CN112257277A - 一种水产品多维生长因子选取方法及应用 - Google Patents
一种水产品多维生长因子选取方法及应用 Download PDFInfo
- Publication number
- CN112257277A CN112257277A CN202011164522.7A CN202011164522A CN112257277A CN 112257277 A CN112257277 A CN 112257277A CN 202011164522 A CN202011164522 A CN 202011164522A CN 112257277 A CN112257277 A CN 112257277A
- Authority
- CN
- China
- Prior art keywords
- growth factor
- matrix
- sample data
- key
- growth
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- Farming Of Fish And Shellfish (AREA)
Abstract
本发明涉及一种水产品多维生长因子选取方法,步骤如下:以原始样本数据构造n×p阶矩阵;对原始样本数据矩阵做变换,并计算矩阵的特征值及其对应的正交化单位特征向量;依据特征值的降序排列计算综合原始样本数据变量的生长因子,计算累计贡献率;建立逐步回归方程;计算关键生长因子与原始样本数据变量之间的关联程度;观察得出原始样本数据中各变量对关键生长因子的影响,对关键生长因子进行解释。本方法具有概念简单、计算方便、线性重构误差最优等特性,具有较好的实用价值;选取的生长因子综合了各类与水产品生长发育相关的因素,可依据综合系数对关键生长因子予以解释,为后续的生长模型构建以及未来探索生长因素的关联规律奠定了基础。
Description
技术领域
本发明属于水产技术领域,尤其是一种水产品多维生长因子选取方法及应用。
背景技术
用于建立水产品生长模型的样本数据涉及投喂、水质、环境等多个方面,含有多个类别影响水产品生长发育的因素。生长因子反映了水产品生长发育的某些特征信息,它们综合在一起又能够描述水产品生长发育的客观规律。这些生长因子变量对应着水产品建模数据的不同维度,而多维数据又蕴含了有关水产品生长的丰富、细致的信息。
水产品建模数据各维度之间具有一定的相关性,相关性则会造成所反映信息的重叠。当采用机器学习技术建立水产品生长模型时,数据的每个维度对应一个输入变量。如果输入变量过多就会导致机器学习模型结构变得复杂,使得训练负担加重、学习速度下降;而输入变量过少又会影响预测精度;如果输入变量中包含了一些与输出结果相关性较小的输入变量,则会增加陷入局部极小值的可能性,进而导致模型精度及性能的下降。因此,只有减少水产品建模数据中各维度之间的相关性、降低建模数据的维度、找出一组合适的生长因子变量作为模型的输入,才能有效地构建反应生长因子与生长发育情况映射关系的模型,使得该模型能够准确地反映水产品的生长趋势。
通过检索,尚未发现与本发明专利申请相关的专利公开文献。
发明内容
本发明的目的在于克服现有技术中的不足之处,提供一种水产品多维生长因子选取方法及应用。
本发明解决其技术问题所采用的技术方案是:
一种水产品多维生长因子选取方法,步骤如下:
第一步:采集到n个水产品生长因素样本数据,每个样本有p个变量,以原始样本数据构造n×p阶矩阵X,即X=[X1,X2,...,Xp]T,其中Xi=[xi1,xi2,...,xip]T,i=1,2,…,n;
第二步:对原始样本数据矩阵X做如下变换:
第三步:计算矩阵R=(rij)p×p=X*X*T,rij=rji,其中
第五步:选取G(m)大于等于85%、位于特征值碎石图肘部且其Kaiser特征值大于1的综合生长因子作为水产品关键生长因子,以关键生长因子为荷载集水产品生长指标为荷载效应建立逐步回归方程,并通过与原始观测数据的拟合方差对比、评价基于关键生长因子所建立的预期模型的性态,进而实现对水产品关键生长因子的验证与评价;
第六步:计算m个关键生长因子Zi与原始样本数据变量Xj之间的关联程度,
lij(i=1,2,…,m;j=1,2,…,p),其中
构造矩阵L,即
第七步:对矩阵L进行斜交旋转运算得矩阵A,即
观察A得出原始样本数据中各变量对关键生长因子的影响,进而结合原始变量的理化意义对关键生长因子进行解释。
如上所述的水产品多维生长因子选取方法在水产品生长方面中的应用。
本发明取得的优点和积极效果为:
1、本发明所提出了一种基于统计分析技术的水产品关键生长因子选取方法,降低了水产品生长建模数据的维度,实现了建模特征数据的提取。该方法具有概念简单、计算方便、线性重构误差最优等特性,具有较好的实用价值;该方法选取的生长因子综合了各类与水产品生长发育相关的因素,可依据综合系数对关键生长因子予以解释,为后续的生长模型构建以及未来探索生长因素的关联规律奠定了基础。
2、本发明方法的目标是寻找出研究对象总变量数中的个别新变量,使它们能够反映事物的主要特征,压缩原有数据的规模,降低用于建模的特征向量的维度,挑选出最重要的特征。由于每个新变量都是原有变量的线性组合,体现了原有变量的综合效果,具有更高的实际含义。经过本发明方法所选取出的水产品生长因子数据作为生长模型的输入,保证了不降低训练数据的样本总量的同时,消除了模型输入样本之间的相关性,使得模型的训练速度等各方面的性能得到改善。
附图说明
图1为本发明水产品关键生长因子的一种选取流程图;
图2为本发明中备选关键生长因子拟合结果对比图。
具体实施方式
下面结合实施例,对本发明进一步说明,下属实施例是叙述性的,不是限定性的,不能以下述实施例来限定本发明的保护范围。
本发明中所使用的原料,如无特殊说明,均为常规市售产品,本发明中所使用的方法,如无特殊说明,均为本领域常规方法,本发明所用各物质质量均为常规使用质量。
一种水产品多维生长因子选取方法,步骤如下:
第一步:采集到n个水产品生长因素样本数据,每个样本有p个变量,以原始样本数据构造n×p阶矩阵X,即X=[X1,X2,...,Xp]T,其中Xi=[xi1,xi2,...,xip]T,i=1,2,…,n;
第二步:对原始样本数据矩阵X做如下变换:
第三步:计算矩阵R=(rij)p×p=X*X*T,rij=rji,其中
第五步:选取G(m)大于等于85%、位于特征值碎石图肘部且其Kaiser特征值大于1的综合生长因子作为水产品关键生长因子,以关键生长因子为荷载集水产品生长指标为荷载效应建立逐步回归方程,并通过与原始观测数据的拟合方差对比、评价基于关键生长因子所建立的预期模型的性态,进而实现对水产品关键生长因子的验证与评价;
第六步:计算m个关键生长因子Zi与原始样本数据变量Xj之间的关联程度,
lij(i=1,2,…,m;j=1,2,…,p),其中
构造矩阵L,即
第七步:对矩阵L进行斜交旋转运算得矩阵A,即
观察A得出原始样本数据中各变量对关键生长因子的影响,进而结合原始变量的理化意义对关键生长因子进行解释。
如上所述的水产品多维生长因子选取方法在水产品生长方面中的应用。
具体地,相关制备及检测如下:
以工厂化海水养殖基地所采集的涉及投喂、水质、环境等4个方面,共计15类影响水产品生长发育的因素,构成原始样本上数据,经本发明所提出的方法计算得到如下各综合生长因子矩阵如表1所示,从表1可以看出,表中每行为样本数据中某因素变量分别在各综合生长因子中的系数,每列为各类因素变量分别在某综合生长因子中的系数,该表反应了与水产品生长发育相关的因素变量对综合生长因子的影响。
表1综合生长因子矩阵(节选)
依据矩阵R的特征值降序对综合生长因子排序,并计算Kaiser特征值及累积贡献率,相应计算结果如表2所示,从表2可以看出,依特征值降序排列的综合生长因子中的前6个贡献率累积后超过了85%,而其中前5个Kaiser特征值大于1。
表2各生长因子特征值及贡献率计算结果
采用本发明所述的累积贡献率、Kaiser特征值判别以及观察碎石图肘部相结合的方法,可从依据特征值降序排列的综合生长因子序列中提取前4到6个生长因子作为关键生长因子的备选;再通过本发明所述的建立回归方程并计算方差统计量的方法,对备选关键生长因子进行验证、评价,并选取最终的关键生长因子,相关验证对比分析如图2所示,从图2可以看出,通过将拟合结果与实际生长指标值进行对比,发现5个和6个生长因子的拟合结果相近,且拟合效果较好,能够较好地反应各个关键生长因子与水产品体重指标之间的关系;而4个生长因子的拟合结果与实际体重对比显示,拟合波动大,效果较差。如表3所示,据回归拟合系数、方差R-square和均方根误差RMSE对比情况所示,生长指标拟合方差0.964最接近于1,表明该列所示的关键生长因子提取数量6为最佳,即选取前6个综合生长因子作为关键生长因子可用于建立相应的水产品生长模型。
表3回归系数、方差及均方根误差对比
关键因子系数矩阵表示原始指标变量与提取的关键因子之间的关系,6个关键因子系数矩阵A如表4所示。所选取的各关键生长因子综合了选取之前的原始样本数据中的各类生长因素。各综合与关联的关系,与多年来水产养殖业形成的一些经验结果、研究成果基本吻合,并且能够为进一步揭示潜在的规律提供数据及统计规律上的支持。
表4关键因子系数矩阵
尽管为说明目的公开了本发明的实施例,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例所公开的内容。
Claims (2)
1.一种水产品多维生长因子选取方法,其特征在于:步骤如下:
第一步:采集到n个水产品生长因素样本数据,每个样本有p个变量,以原始样本数据构造n×p阶矩阵X,即X=[X1,X2,...,Xp]T,其中Xi=[xi1,xi2,...,xip]T,i=1,2,…,n;
第二步:对原始样本数据矩阵X做如下变换:
第五步:选取G(m)大于等于85%、位于特征值碎石图肘部且其Kaiser特征值大于1的综合生长因子作为水产品关键生长因子,以关键生长因子为荷载集水产品生长指标为荷载效应建立逐步回归方程,并通过与原始观测数据的拟合方差对比、评价基于关键生长因子所建立的预期模型的性态,进而实现对水产品关键生长因子的验证与评价;
第六步:计算m个关键生长因子Zi与原始样本数据变量Xj之间的关联程度,
lij(i=1,2,…,m;j=1,2,…,p),其中
构造矩阵L,即
第七步:对矩阵L进行斜交旋转运算得矩阵A,即
观察A得出原始样本数据中各变量对关键生长因子的影响,进而结合原始变量的理化意义对关键生长因子进行解释。
2.如权利要求1所述的水产品多维生长因子选取方法在水产品生长方面中的应用。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011164522.7A CN112257277A (zh) | 2020-10-27 | 2020-10-27 | 一种水产品多维生长因子选取方法及应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011164522.7A CN112257277A (zh) | 2020-10-27 | 2020-10-27 | 一种水产品多维生长因子选取方法及应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257277A true CN112257277A (zh) | 2021-01-22 |
Family
ID=74261200
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011164522.7A Pending CN112257277A (zh) | 2020-10-27 | 2020-10-27 | 一种水产品多维生长因子选取方法及应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257277A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120209575A1 (en) * | 2011-02-11 | 2012-08-16 | Ford Global Technologies, Llc | Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis |
CN107545380A (zh) * | 2017-10-13 | 2018-01-05 | 常州工学院 | 基于主成分分析的城市宜居性评价模型 |
CN110046645A (zh) * | 2019-03-04 | 2019-07-23 | 三峡大学 | 一种基于主成分分析与bp神经网络的藻类水华预测方法 |
CN110476839A (zh) * | 2019-07-24 | 2019-11-22 | 中国农业大学 | 一种基于鱼类生长的优化调控方法及系统 |
-
2020
- 2020-10-27 CN CN202011164522.7A patent/CN112257277A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120209575A1 (en) * | 2011-02-11 | 2012-08-16 | Ford Global Technologies, Llc | Method and System for Model Validation for Dynamic Systems Using Bayesian Principal Component Analysis |
CN107545380A (zh) * | 2017-10-13 | 2018-01-05 | 常州工学院 | 基于主成分分析的城市宜居性评价模型 |
CN110046645A (zh) * | 2019-03-04 | 2019-07-23 | 三峡大学 | 一种基于主成分分析与bp神经网络的藻类水华预测方法 |
CN110476839A (zh) * | 2019-07-24 | 2019-11-22 | 中国农业大学 | 一种基于鱼类生长的优化调控方法及系统 |
Non-Patent Citations (1)
Title |
---|
熊邦喜 等: "影响水库鱼产量的生态因子的主成分分析", 《水利渔业》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109597968B (zh) | 基于smt大数据的锡膏印刷性能影响因素分析方法 | |
CN104376434B (zh) | 卷烟多点加工质量的综合评价方法 | |
WO2021073541A1 (zh) | 一种基于光谱相似度的校正集和验证集的选择及建模方法 | |
CN110569566B (zh) | 一种板带力学性能预测方法 | |
CN110929347A (zh) | 一种基于梯度提升树模型的热连轧带钢凸度预测方法 | |
CN110726694A (zh) | 光谱变量梯度集成遗传算法的特征波长选择方法和系统 | |
Todorov et al. | Comparative performance of several robust linear discriminant analysis methods | |
CN105431854B (zh) | 用于分析生物样品的方法和设备 | |
CN113066525B (zh) | 一种基于集成学习与混合神经网络的多靶标药物筛选方法 | |
CN114093515A (zh) | 一种基于肠道菌群预测模型集成学习的年龄预测方法 | |
CN113865868A (zh) | 基于时频域表达的滚动轴承故障诊断方法 | |
CN116541607B (zh) | 基于商品检索数据分析的智能推荐方法 | |
CN112289391A (zh) | 一种基于机器学习的阳极铝箔性能预测系统 | |
CN110379521A (zh) | 基于信息论的医疗数据集特征选择方法 | |
CN113935535A (zh) | 一种面向中长期预测模型的主成分分析方法 | |
CN113420795A (zh) | 一种基于空洞卷积神经网络的矿物光谱分类方法 | |
CN116423924A (zh) | 纸板线湿部生产速度模型构建方法及生产速度预测方法 | |
CN113240527A (zh) | 基于可解释机器学习的债券市场违约风险预警方法 | |
CN111784065A (zh) | 一种基于灰关联的油井产能智能预测方法 | |
JP2010218187A (ja) | 製造条件調整装置 | |
CN112085062A (zh) | 一种基于小波神经网络的异常能耗定位方法 | |
CN111736567A (zh) | 一种基于故障敏感慢特征的多块故障监测方法 | |
CN112257277A (zh) | 一种水产品多维生长因子选取方法及应用 | |
CN113011086B (zh) | 一种基于ga-svr算法森林生物量的估测方法 | |
CN115204634A (zh) | 一种灰色关联度与博弈论的农作物质量评价方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210122 |
|
RJ01 | Rejection of invention patent application after publication |