CN112257277A - 一种水产品多维生长因子选取方法及应用 - Google Patents

一种水产品多维生长因子选取方法及应用 Download PDF

Info

Publication number
CN112257277A
CN112257277A CN202011164522.7A CN202011164522A CN112257277A CN 112257277 A CN112257277 A CN 112257277A CN 202011164522 A CN202011164522 A CN 202011164522A CN 112257277 A CN112257277 A CN 112257277A
Authority
CN
China
Prior art keywords
growth factor
matrix
sample data
key
growth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011164522.7A
Other languages
English (en)
Inventor
华旭峰
郑迎坤
孙学亮
田云臣
薛洋洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Agricultural University
Original Assignee
Tianjin Agricultural University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Agricultural University filed Critical Tianjin Agricultural University
Priority to CN202011164522.7A priority Critical patent/CN112257277A/zh
Publication of CN112257277A publication Critical patent/CN112257277A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • Farming Of Fish And Shellfish (AREA)

Abstract

本发明涉及一种水产品多维生长因子选取方法,步骤如下:以原始样本数据构造n×p阶矩阵;对原始样本数据矩阵做变换,并计算矩阵的特征值及其对应的正交化单位特征向量;依据特征值的降序排列计算综合原始样本数据变量的生长因子,计算累计贡献率;建立逐步回归方程;计算关键生长因子与原始样本数据变量之间的关联程度;观察得出原始样本数据中各变量对关键生长因子的影响,对关键生长因子进行解释。本方法具有概念简单、计算方便、线性重构误差最优等特性,具有较好的实用价值;选取的生长因子综合了各类与水产品生长发育相关的因素,可依据综合系数对关键生长因子予以解释,为后续的生长模型构建以及未来探索生长因素的关联规律奠定了基础。

Description

一种水产品多维生长因子选取方法及应用
技术领域
本发明属于水产技术领域,尤其是一种水产品多维生长因子选取方法及应用。
背景技术
用于建立水产品生长模型的样本数据涉及投喂、水质、环境等多个方面,含有多个类别影响水产品生长发育的因素。生长因子反映了水产品生长发育的某些特征信息,它们综合在一起又能够描述水产品生长发育的客观规律。这些生长因子变量对应着水产品建模数据的不同维度,而多维数据又蕴含了有关水产品生长的丰富、细致的信息。
水产品建模数据各维度之间具有一定的相关性,相关性则会造成所反映信息的重叠。当采用机器学习技术建立水产品生长模型时,数据的每个维度对应一个输入变量。如果输入变量过多就会导致机器学习模型结构变得复杂,使得训练负担加重、学习速度下降;而输入变量过少又会影响预测精度;如果输入变量中包含了一些与输出结果相关性较小的输入变量,则会增加陷入局部极小值的可能性,进而导致模型精度及性能的下降。因此,只有减少水产品建模数据中各维度之间的相关性、降低建模数据的维度、找出一组合适的生长因子变量作为模型的输入,才能有效地构建反应生长因子与生长发育情况映射关系的模型,使得该模型能够准确地反映水产品的生长趋势。
通过检索,尚未发现与本发明专利申请相关的专利公开文献。
发明内容
本发明的目的在于克服现有技术中的不足之处,提供一种水产品多维生长因子选取方法及应用。
本发明解决其技术问题所采用的技术方案是:
一种水产品多维生长因子选取方法,步骤如下:
第一步:采集到n个水产品生长因素样本数据,每个样本有p个变量,以原始样本数据构造n×p阶矩阵X,即X=[X1,X2,...,Xp]T,其中Xi=[xi1,xi2,...,xip]T,i=1,2,…,n;
第二步:对原始样本数据矩阵X做如下变换:
Figure BDA0002745360580000021
i=1,2,…,n;j=1,2,…,p,
其中
Figure BDA0002745360580000022
得到矩阵
Figure BDA0002745360580000023
其中
Figure BDA0002745360580000024
i=1,2,…,n;
第三步:计算矩阵R=(rij)p×p=X*X*T,rij=rji,其中
Figure BDA0002745360580000025
i,j=1,2,…,p,k=1,2,…,n,并计算矩阵R的特征值λi及其对应的正交化单位特征向量ai
第四步:依据特征值λi的降序排列计算综合原始样本数据变量的生长因子Zi,即
Figure BDA0002745360580000026
计算序列中综合生长因子Zm的累计贡献率G(m),即
Figure BDA0002745360580000027
第五步:选取G(m)大于等于85%、位于特征值碎石图肘部且其Kaiser特征值大于1的综合生长因子作为水产品关键生长因子,以关键生长因子为荷载集水产品生长指标为荷载效应建立逐步回归方程,并通过与原始观测数据的拟合方差对比、评价基于关键生长因子所建立的预期模型的性态,进而实现对水产品关键生长因子的验证与评价;
第六步:计算m个关键生长因子Zi与原始样本数据变量Xj之间的关联程度,
lij(i=1,2,…,m;j=1,2,…,p),其中
Figure BDA0002745360580000028
(i=1,2,…,m;j=1,2,…,p)。
构造矩阵L,即
Figure BDA0002745360580000031
第七步:对矩阵L进行斜交旋转运算得矩阵A,即
Figure BDA0002745360580000032
观察A得出原始样本数据中各变量对关键生长因子的影响,进而结合原始变量的理化意义对关键生长因子进行解释。
如上所述的水产品多维生长因子选取方法在水产品生长方面中的应用。
本发明取得的优点和积极效果为:
1、本发明所提出了一种基于统计分析技术的水产品关键生长因子选取方法,降低了水产品生长建模数据的维度,实现了建模特征数据的提取。该方法具有概念简单、计算方便、线性重构误差最优等特性,具有较好的实用价值;该方法选取的生长因子综合了各类与水产品生长发育相关的因素,可依据综合系数对关键生长因子予以解释,为后续的生长模型构建以及未来探索生长因素的关联规律奠定了基础。
2、本发明方法的目标是寻找出研究对象总变量数中的个别新变量,使它们能够反映事物的主要特征,压缩原有数据的规模,降低用于建模的特征向量的维度,挑选出最重要的特征。由于每个新变量都是原有变量的线性组合,体现了原有变量的综合效果,具有更高的实际含义。经过本发明方法所选取出的水产品生长因子数据作为生长模型的输入,保证了不降低训练数据的样本总量的同时,消除了模型输入样本之间的相关性,使得模型的训练速度等各方面的性能得到改善。
附图说明
图1为本发明水产品关键生长因子的一种选取流程图;
图2为本发明中备选关键生长因子拟合结果对比图。
具体实施方式
下面结合实施例,对本发明进一步说明,下属实施例是叙述性的,不是限定性的,不能以下述实施例来限定本发明的保护范围。
本发明中所使用的原料,如无特殊说明,均为常规市售产品,本发明中所使用的方法,如无特殊说明,均为本领域常规方法,本发明所用各物质质量均为常规使用质量。
一种水产品多维生长因子选取方法,步骤如下:
第一步:采集到n个水产品生长因素样本数据,每个样本有p个变量,以原始样本数据构造n×p阶矩阵X,即X=[X1,X2,...,Xp]T,其中Xi=[xi1,xi2,...,xip]T,i=1,2,…,n;
第二步:对原始样本数据矩阵X做如下变换:
Figure BDA0002745360580000041
i=1,2,…,n;j=1,2,…,p,
其中
Figure BDA0002745360580000042
得到矩阵
Figure BDA0002745360580000043
其中
Figure BDA0002745360580000044
i=1,2,…,n;
第三步:计算矩阵R=(rij)p×p=X*X*T,rij=rji,其中
Figure BDA0002745360580000045
i,j=1,2,…,p,k=1,2,…,n,并计算矩阵R的特征值λi及其对应的正交化单位特征向量αi
第四步:依据特征值λi的降序排列计算综合原始样本数据变量的生长因子Zi,即
Figure BDA0002745360580000046
计算序列中综合生长因子Zm的累计贡献率G(m),即
Figure BDA0002745360580000047
第五步:选取G(m)大于等于85%、位于特征值碎石图肘部且其Kaiser特征值大于1的综合生长因子作为水产品关键生长因子,以关键生长因子为荷载集水产品生长指标为荷载效应建立逐步回归方程,并通过与原始观测数据的拟合方差对比、评价基于关键生长因子所建立的预期模型的性态,进而实现对水产品关键生长因子的验证与评价;
第六步:计算m个关键生长因子Zi与原始样本数据变量Xj之间的关联程度,
lij(i=1,2,…,m;j=1,2,…,p),其中
Figure BDA0002745360580000051
(i=1,2,…,m;j=1,2,…,p)。
构造矩阵L,即
Figure BDA0002745360580000052
第七步:对矩阵L进行斜交旋转运算得矩阵A,即
Figure BDA0002745360580000053
观察A得出原始样本数据中各变量对关键生长因子的影响,进而结合原始变量的理化意义对关键生长因子进行解释。
如上所述的水产品多维生长因子选取方法在水产品生长方面中的应用。
具体地,相关制备及检测如下:
以工厂化海水养殖基地所采集的涉及投喂、水质、环境等4个方面,共计15类影响水产品生长发育的因素,构成原始样本上数据,经本发明所提出的方法计算得到如下各综合生长因子矩阵如表1所示,从表1可以看出,表中每行为样本数据中某因素变量分别在各综合生长因子中的系数,每列为各类因素变量分别在某综合生长因子中的系数,该表反应了与水产品生长发育相关的因素变量对综合生长因子的影响。
表1综合生长因子矩阵(节选)
Figure BDA0002745360580000061
依据矩阵R的特征值降序对综合生长因子排序,并计算Kaiser特征值及累积贡献率,相应计算结果如表2所示,从表2可以看出,依特征值降序排列的综合生长因子中的前6个贡献率累积后超过了85%,而其中前5个Kaiser特征值大于1。
表2各生长因子特征值及贡献率计算结果
Figure BDA0002745360580000062
Figure BDA0002745360580000071
采用本发明所述的累积贡献率、Kaiser特征值判别以及观察碎石图肘部相结合的方法,可从依据特征值降序排列的综合生长因子序列中提取前4到6个生长因子作为关键生长因子的备选;再通过本发明所述的建立回归方程并计算方差统计量的方法,对备选关键生长因子进行验证、评价,并选取最终的关键生长因子,相关验证对比分析如图2所示,从图2可以看出,通过将拟合结果与实际生长指标值进行对比,发现5个和6个生长因子的拟合结果相近,且拟合效果较好,能够较好地反应各个关键生长因子与水产品体重指标之间的关系;而4个生长因子的拟合结果与实际体重对比显示,拟合波动大,效果较差。如表3所示,据回归拟合系数、方差R-square和均方根误差RMSE对比情况所示,生长指标拟合方差0.964最接近于1,表明该列所示的关键生长因子提取数量6为最佳,即选取前6个综合生长因子作为关键生长因子可用于建立相应的水产品生长模型。
表3回归系数、方差及均方根误差对比
Figure BDA0002745360580000072
关键因子系数矩阵表示原始指标变量与提取的关键因子之间的关系,6个关键因子系数矩阵A如表4所示。所选取的各关键生长因子综合了选取之前的原始样本数据中的各类生长因素。各综合与关联的关系,与多年来水产养殖业形成的一些经验结果、研究成果基本吻合,并且能够为进一步揭示潜在的规律提供数据及统计规律上的支持。
表4关键因子系数矩阵
Figure BDA0002745360580000081
尽管为说明目的公开了本发明的实施例,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例所公开的内容。

Claims (2)

1.一种水产品多维生长因子选取方法,其特征在于:步骤如下:
第一步:采集到n个水产品生长因素样本数据,每个样本有p个变量,以原始样本数据构造n×p阶矩阵X,即X=[X1,X2,...,Xp]T,其中Xi=[xi1,xi2,...,xip]T,i=1,2,…,n;
第二步:对原始样本数据矩阵X做如下变换:
Figure FDA0002745360570000011
其中
Figure FDA0002745360570000012
得到矩阵
Figure FDA0002745360570000013
其中
Figure FDA0002745360570000014
i=1,2,…,n;
第三步:计算矩阵
Figure FDA0002745360570000015
rij=rji,其中
Figure FDA0002745360570000016
并计算矩阵R的特征值λi及其对应的正交化单位特征向量ai
第四步:依据特征值λi的降序排列计算综合原始样本数据变量的生长因子Zi,即
Figure FDA0002745360570000017
计算序列中综合生长因子Zm的累计贡献率G(m),即
Figure FDA0002745360570000018
第五步:选取G(m)大于等于85%、位于特征值碎石图肘部且其Kaiser特征值大于1的综合生长因子作为水产品关键生长因子,以关键生长因子为荷载集水产品生长指标为荷载效应建立逐步回归方程,并通过与原始观测数据的拟合方差对比、评价基于关键生长因子所建立的预期模型的性态,进而实现对水产品关键生长因子的验证与评价;
第六步:计算m个关键生长因子Zi与原始样本数据变量Xj之间的关联程度,
lij(i=1,2,…,m;j=1,2,…,p),其中
Figure FDA0002745360570000021
构造矩阵L,即
Figure FDA0002745360570000022
第七步:对矩阵L进行斜交旋转运算得矩阵A,即
Figure FDA0002745360570000023
观察A得出原始样本数据中各变量对关键生长因子的影响,进而结合原始变量的理化意义对关键生长因子进行解释。
2.如权利要求1所述的水产品多维生长因子选取方法在水产品生长方面中的应用。
CN202011164522.7A 2020-10-27 2020-10-27 一种水产品多维生长因子选取方法及应用 Pending CN112257277A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011164522.7A CN112257277A (zh) 2020-10-27 2020-10-27 一种水产品多维生长因子选取方法及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011164522.7A CN112257277A (zh) 2020-10-27 2020-10-27 一种水产品多维生长因子选取方法及应用

Publications (1)

Publication Number Publication Date
CN112257277A true CN112257277A (zh) 2021-01-22

Family

ID=74261200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011164522.7A Pending CN112257277A (zh) 2020-10-27 2020-10-27 一种水产品多维生长因子选取方法及应用

Country Status (1)

Country Link
CN (1) CN112257277A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120209575A1 (en) * 2011-02-11 2012-08-16 Ford Global Technologies, Llc Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis
CN107545380A (zh) * 2017-10-13 2018-01-05 常州工学院 基于主成分分析的城市宜居性评价模型
CN110046645A (zh) * 2019-03-04 2019-07-23 三峡大学 一种基于主成分分析与bp神经网络的藻类水华预测方法
CN110476839A (zh) * 2019-07-24 2019-11-22 中国农业大学 一种基于鱼类生长的优化调控方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120209575A1 (en) * 2011-02-11 2012-08-16 Ford Global Technologies, Llc Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis
CN107545380A (zh) * 2017-10-13 2018-01-05 常州工学院 基于主成分分析的城市宜居性评价模型
CN110046645A (zh) * 2019-03-04 2019-07-23 三峡大学 一种基于主成分分析与bp神经网络的藻类水华预测方法
CN110476839A (zh) * 2019-07-24 2019-11-22 中国农业大学 一种基于鱼类生长的优化调控方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
熊邦喜 等: "影响水库鱼产量的生态因子的主成分分析", 《水利渔业》 *

Similar Documents

Publication Publication Date Title
CN109597968B (zh) 基于smt大数据的锡膏印刷性能影响因素分析方法
CN104376434B (zh) 卷烟多点加工质量的综合评价方法
WO2021073541A1 (zh) 一种基于光谱相似度的校正集和验证集的选择及建模方法
CN110569566B (zh) 一种板带力学性能预测方法
CN110929347A (zh) 一种基于梯度提升树模型的热连轧带钢凸度预测方法
CN110726694A (zh) 光谱变量梯度集成遗传算法的特征波长选择方法和系统
Todorov et al. Comparative performance of several robust linear discriminant analysis methods
CN105431854B (zh) 用于分析生物样品的方法和设备
CN113066525B (zh) 一种基于集成学习与混合神经网络的多靶标药物筛选方法
CN114093515A (zh) 一种基于肠道菌群预测模型集成学习的年龄预测方法
CN113865868A (zh) 基于时频域表达的滚动轴承故障诊断方法
CN116541607B (zh) 基于商品检索数据分析的智能推荐方法
CN112289391A (zh) 一种基于机器学习的阳极铝箔性能预测系统
CN110379521A (zh) 基于信息论的医疗数据集特征选择方法
CN113935535A (zh) 一种面向中长期预测模型的主成分分析方法
CN113420795A (zh) 一种基于空洞卷积神经网络的矿物光谱分类方法
CN116423924A (zh) 纸板线湿部生产速度模型构建方法及生产速度预测方法
CN113240527A (zh) 基于可解释机器学习的债券市场违约风险预警方法
CN111784065A (zh) 一种基于灰关联的油井产能智能预测方法
JP2010218187A (ja) 製造条件調整装置
CN112085062A (zh) 一种基于小波神经网络的异常能耗定位方法
CN111736567A (zh) 一种基于故障敏感慢特征的多块故障监测方法
CN112257277A (zh) 一种水产品多维生长因子选取方法及应用
CN113011086B (zh) 一种基于ga-svr算法森林生物量的估测方法
CN115204634A (zh) 一种灰色关联度与博弈论的农作物质量评价方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210122

RJ01 Rejection of invention patent application after publication