CN110954666B - 一种基于偏最小二乘判别分析模型的茶叶等级判别方法 - Google Patents

一种基于偏最小二乘判别分析模型的茶叶等级判别方法 Download PDF

Info

Publication number
CN110954666B
CN110954666B CN201911111535.5A CN201911111535A CN110954666B CN 110954666 B CN110954666 B CN 110954666B CN 201911111535 A CN201911111535 A CN 201911111535A CN 110954666 B CN110954666 B CN 110954666B
Authority
CN
China
Prior art keywords
data
grade
tea
index value
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911111535.5A
Other languages
English (en)
Other versions
CN110954666A (zh
Inventor
陈孝敬
孟留伟
袁雷明
石文
黄光造
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wenzhou University
Original Assignee
Wenzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wenzhou University filed Critical Wenzhou University
Priority to CN201911111535.5A priority Critical patent/CN110954666B/zh
Publication of CN110954666A publication Critical patent/CN110954666A/zh
Application granted granted Critical
Publication of CN110954666B publication Critical patent/CN110954666B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/02Food
    • G01N33/14Beverages

Landscapes

  • Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于偏最小二乘判别分析模型的茶叶等级判别方法,该方法直接构建茶叶样本的响应信号向量与茶叶样本的设定标签之间潜在变量从1到20的20个PLS‑DA模型,采用得到的20个PLS‑DA模型分别对每个茶叶样本进行预测并使用预测结果构建茶叶样本的排序差异总和矩阵,然后基于茶叶样本的排序差异总和矩阵构建得到每个茶叶样本的排序差异总和标准参考序列向量以及构建包含20行1列索引值的第一索引值矩阵后,调整排序差异总和矩阵中各行数据的行数构建得到第二索引值矩阵,最后通过计算绝对差值之和确定茶叶样本等级;优点是判别过程简单,且判别精度较高。

Description

一种基于偏最小二乘判别分析模型的茶叶等级判别方法
技术领域
本发明涉及一种茶叶等级判别方法,尤其是涉及一种基于偏最小二乘判别分析模型的茶叶等级判别方法。
背景技术
茶叶作为一种深受消费者喜爱的饮品,通常根据茶叶色泽、芳香气味、成熟期及各种品质指标将茶叶分成多个等级。为规范茶叶销售市场,保障消费者的合法权益,杜绝茶叶经销商以次级茶充当优级茶进行欺骗性销售,因此常需对茶叶进行品质检测和等级判别。电子舌技术作为一种仿生传感器技术,结合偏最小二乘判别分析(partial leastsquares–discriminant analysis,PLS-DA)模型可以对多等级茶叶样品进行快速分析和识别,从而实现茶叶等级的判别分析。
现有的基于偏最小二乘判别分析模型的茶叶等级判别方法中,为了得到最优分类效果,在采用PLS-DA模型进行判别分析时,通常先需要采用交叉验证计算来确定PLS-DA模型的最优潜在变量值,交叉验证计算不但增加了判别过程的复杂性,而且在交叉验证计算的过程中,通常需要确定交叉验证时取样策略和交叉验证折数,这就意味着不同的取样策略和交叉验证折数可能会得到不同的最优潜在变量值,最终造成PLS-DA模型无法得到最优判别效果,最终导致茶叶等级判别方法的判别精度不高,难以满足精度需求。
发明内容
本发明所要解决的技术问题是提供一种判别过程简单,且判别精度较高的基于偏最小二乘判别分析模型的茶叶等级判别方法。
本发明解决上述技术问题所采用的技术方案为:一种基于偏最小二乘判别分析模型的茶叶等级判别方法,包括以下步骤:
步骤1、获取待判别的m种不同等级的茶叶样本,每种等级的茶叶样本中分别包含n个茶叶样本,获取m种不同等级中每个茶叶样本标注的等级,将第i种等级的茶叶样本标注的等级记为Li,m为大于等于1的整数,n为大于等于1的整数;为第i种等级中第j个茶叶样本设定标签,将其标签以m位二进制数的形式表示为Yij,且m种不同等级的茶叶样本中任意两个茶叶样本的标签均不相同,i=1,2,…,m,j=1,2,…,n;
步骤2、分别采集m种不同等级中每个茶叶样本的电子舌响应信号向量,将第i种等级中第j个茶叶样本的响应信号向量记为Xij
步骤3、构建m种不同等级中每个茶叶样本的排序差异总和(sum of rankingdifferences,SRD)矩阵,具体构建过程为:
3-1、将第i种等级中第j个茶叶样本的排序差异总和(sum of rankingdifferences,SRD)矩阵记为Sij
3-2、建立Xij与Yij之间潜在变量从1到20的20个PLS-DA模型,得到第i种等级中第j个茶叶样本对应的20个PLS-DA模型;
3-3、对第i种等级中第j个茶叶样本分别采用建立的20个PLS-DA模型进行预测,分别得到第i种等级中第j个茶叶样本的20个预测结果,将第i种等级中第j个茶叶样本采用潜在变量为k的PLS-DA模型进行预测得到的预测结果记为Skij,Skij为包含1行m列的向量,k=1,2,…,20;
3-4、将Skij中的1行m列数据作为第i种等级中第j个茶叶样本的排序差异总和矩阵Sij的第k行数据,构建得到Sij,Sij为20行m列的矩阵;
步骤4、构建m种不同等级中每个茶叶样本的排序差异总和标准参考序列向量,具体构建过程为:
4-1、将第i种等级中第j个茶叶样本的排序差异总和标准参考序列向量记为Bij
4-2、获取Sij中每行数据中的最大值,将Sij中第k行数据中的最大值作为Bij中第k行数据,得到Bij,Bij为20行1列的向量;
步骤5、构建第一索引值矩阵,将其记为B1,所述的第一索引值矩阵为包含20行1列索引值的矩阵,所述的第一索引值矩阵中第h行1列的索引值等于h,h=1,2,…,20;
步骤6、调整排序差异总和矩阵Sij中各行数据的行数,具体过程为:
6-1、根据Bij中包含的20行数据的大小对Bij中各行数据的行数进行调整,具体调整规则为:数据小的行数小,数据大的行数大,当出现两个或者多个相等的数据时,这几个相等的数据所处行数的大小按序随机确定即可,将调整后的Bij记为B1ij
6-2、根据B1ij对Sij中各行数据的行数进行调整,使B1ij中每行数据的行数与该行数据从Sij中获取时所处行数据的行数相等,由此得到调整后的Sij,将调整后Sij记为S1ij
步骤7、构建包含20行m列索引值的第二索引值矩阵,具体过程为:构建用于存放20个索引值的索引值列向量Cij,比较S1ij中位于第i列中20个数据的大小,按照以下方式设定S1ij中位于第i列中20个数据的索引值:
首先找到S1ij中位于第i列中20个数据中的最小数据,将最小数据的索引值设定为1,如果存在r个最小数据,r为大于等于2的整数,则这r个最小数据的索引值均设定为1,然后找到第二小的数据,将其索引值设定为r+1,如果存在t个第二小的数据,t为大于等于2的整数,则这t个第二小的数据的索引值均设定为r+1,接着找到第三小的数据,将其索引值设定为r+t+1,以此类推,直至找到最大数据完成最大数据的索引值设定;
将S1ij中位于第i列中20个数据的索引值存放到Cij中,且每个数据的索引值在Cij中所处行数等于该数据在S1ij所处行数,将Cij中的20行1列数据作为矩阵的第i列数据,最终得到包含20行m列索引值的第二索引值矩阵;
步骤8、将第二索引值矩阵中第i列索引值与第一索引值矩阵中1列数据的绝对差值之和记为SRDij,其中SRDij等于第二索引值矩阵中第i列第1行索引值与第一索引值矩阵中第1行1列数据之差的绝对值~第二索引值矩阵中第i列第20行索引值与第一索引值矩阵中第20行1列数据之差的绝对值之和,得到m个绝对差值之和SRD1j~SRDmj
步骤9、比较计算得到的SRD1j~SRDmj,找到其中的最小值,并确定计算得到该最小值的第二索引值矩阵中的一列索引值所对应的列数,该列数即为第i种等级中第j个茶叶样本所对应的茶叶等级;
步骤10、按照步骤2-步骤9的方法得到m种不同等级中每个茶叶样本的等级,然后将得到的第i种等级的茶叶样本的等级与其标注的等级Li进行比较,判定两者是否相同,从而完成m种不同等级中所有茶叶样本等级的快速鉴别。
与现有技术相比,本发明的优点在于直接构建茶叶样本的响应信号向量与茶叶样本的设定标签之间潜在变量从1到20的20个PLS-DA模型,采用得到的20个PLS-DA模型分别对每个茶叶样本进行预测并预测结果构建茶叶样本的排序差异总和(sum of rankingdifferences,SRD)矩阵,然后基于茶叶样本的排序差异总和矩阵构建得到每个茶叶样本的排序差异总和标准参考序列向量以及构建包含20行1列索引值的第一索引值矩阵后,调整排序差异总和矩阵中各行数据的行数构建得到第二索引值矩阵,最后通过计算第二索引值矩阵中每列索引值与第一索引值矩阵中1列数据的绝对差值之和得到m个绝对差值之和,基于绝对差值之和的最小值确定茶叶样本等级,本发明的方法中无需进行交叉验证来计算PLS-DA模型的最优潜在变量,基于排序差异总和方式对PLS-DA模型进行优化,判别过程简单,且判别精度较高。
具体实施方式
以下结合实施例对本发明作进一步详细描述。
实施例:一种基于偏最小二乘判别分析模型的茶叶等级判别方法,包括以下步骤:
步骤1、获取待判别的m种不同等级的茶叶样本,每种等级的茶叶样本中分别包含n个茶叶样本,获取m种不同等级中每个茶叶样本标注的等级,将第i种等级的茶叶样本标注的等级记为Li,m为大于等于1的整数,n为大于等于1的整数;为第i种等级中第j个茶叶样本设定标签,将其标签以m位二进制数的形式表示为Yij,且m种不同等级的茶叶样本中任意两个茶叶样本的标签均不相同,i=1,2,…,m,j=1,2,…,n;
步骤2、分别采集m种不同等级中每个茶叶样本的电子舌响应信号向量,将第i种等级中第j个茶叶样本的响应信号向量记为Xij
步骤3、构建m种不同等级中每个茶叶样本的排序差异总和(sum of rankingdifferences,SRD)矩阵,具体构建过程为:
3-1、将第i种等级中第j个茶叶样本的排序差异总和(sum of rankingdifferences,SRD)矩阵记为Sij
3-2、建立Xij与Yij之间潜在变量从1到20的20个PLS-DA模型,得到第i种等级中第j个茶叶样本对应的20个PLS-DA模型;
3-3、对第i种等级中第j个茶叶样本分别采用建立的20个PLS-DA模型进行预测,分别得到第i种等级中第j个茶叶样本的20个预测结果,将第i种等级中第j个茶叶样本采用潜在变量为k的PLS-DA模型进行预测得到的预测结果记为Skij,Skij为包含1行m列的向量,k=1,2,…,20;
3-4、将Skij中的1行m列数据作为第i种等级中第j个茶叶样本的排序差异总和矩阵Sij的第k行数据,构建得到Sij,Sij为20行m列的矩阵;
步骤4、构建m种不同等级中每个茶叶样本的排序差异总和标准参考序列向量,具体构建过程为:
4-1、将第i种等级中第j个茶叶样本的排序差异总和标准参考序列向量记为Bij
4-2、获取Sij中每行数据中的最大值,将Sij中第k行数据中的最大值作为Bij中第k行数据,得到Bij,Bij为20行1列的向量;
步骤5、构建第一索引值矩阵,将其记为B1,第一索引值矩阵为包含20行1列索引值的矩阵,第一索引值矩阵中第h行1列的索引值等于h,h=1,2,…,20;
步骤6、调整排序差异总和矩阵Sij中各行数据的行数,具体过程为:
6-1、根据Bij中包含的20行数据的大小对Bij中各行数据的行数进行调整,具体调整规则为:数据小的行数小,数据大的行数大,当出现两个或者多个相等的数据时,这几个相等的数据所处行数的大小按序随机确定即可,将调整后的Bij记为B1ij
6-2、根据B1ij对Sij中各行数据的行数进行调整,使B1ij中每行数据的行数与该行数据从Sij中获取时所处行数据的行数相等,由此得到调整后的Sij,将调整后Sij记为S1ij
步骤7、构建包含20行m列索引值的第二索引值矩阵,具体过程为:构建用于存放20个索引值的索引值列向量Cij,比较S1ij中位于第i列中20个数据的大小,按照以下方式设定S1ij中位于第i列中20个数据的索引值:
首先找到S1ij中位于第i列中20个数据中的最小数据,将最小数据的索引值设定为1,如果存在r个最小数据,r为大于等于2的整数,则这r个最小数据的索引值均设定为1,然后找到第二小的数据,将其索引值设定为r+1,如果存在t个第二小的数据,t为大于等于2的整数,则这t个第二小的数据的索引值均设定为r+1,接着找到第三小的数据,将其索引值设定为r+t+1,以此类推,直至找到最大数据完成最大数据的索引值设定;
将S1ij中位于第i列中20个数据的索引值存放到Cij中,且每个数据的索引值在Cij中所处行数等于该数据在S1ij所处行数,将Cij中的20行1列数据作为矩阵的第i列数据,最终得到包含20行m列索引值的第二索引值矩阵;
步骤8、将第二索引值矩阵中第i列索引值与第一索引值矩阵中1列数据的绝对差值之和记为SRDij,其中SRDij等于第二索引值矩阵中第i列第1行索引值与第一索引值矩阵中第1行1列数据之差的绝对值~第二索引值矩阵中第i列第20行索引值与第一索引值矩阵中第20行1列数据之差的绝对值之和,得到m个绝对差值之和SRD1j~SRDmj
步骤9、比较计算得到的SRD1j~SRDmj,找到其中的最小值,并确定计算得到该最小值的第二索引值矩阵中的一列索引值所对应的列数,该列数即为第i种等级中第j个茶叶样本所对应的茶叶等级;
步骤10、按照步骤2-步骤9的方法得到m种不同等级中每个茶叶样本的等级,然后将得到的第i种等级的茶叶样本的等级与其标注的等级Li进行比较,判定两者是否相同,从而完成m种不同等级中所有茶叶样本等级的快速鉴别。

Claims (1)

1.一种基于偏最小二乘判别分析模型的茶叶等级判别方法,其特征在于包括以下步骤:
步骤1、获取待判别的m种不同等级的茶叶样本,每种等级的茶叶样本中分别包含n个茶叶样本,获取m种不同等级中每个茶叶样本标注的等级,将第i种等级的茶叶样本标注的等级记为Li,m为大于等于1的整数,n为大于等于1的整数;为第i种等级中第j个茶叶样本设定标签,将其标签以m位二进制数的形式表示为Yij,且m种不同等级的茶叶样本中任意两个茶叶样本的标签均不相同,i=1,2,…,m,j=1,2,…,n;
步骤2、分别采集m种不同等级中每个茶叶样本的电子舌响应信号向量,将第i种等级中第j个茶叶样本的响应信号向量记为Xij
步骤3、构建m种不同等级中每个茶叶样本的排序差异总和(sum ofrankingdifferences,SRD)矩阵,具体构建过程为:
3-1、将第i种等级中第j个茶叶样本的排序差异总和(sum of ranking differences,SRD)矩阵记为Sij
3-2、建立Xij与Yij之间潜在变量从1到20的20个PLS-DA模型,得到第i种等级中第j个茶叶样本对应的20个PLS-DA模型;
3-3、对第i种等级中第j个茶叶样本分别采用建立的20个PLS-DA模型进行预测,分别得到第i种等级中第j个茶叶样本的20个预测结果,将第i种等级中第j个茶叶样本采用潜在变量为k的PLS-DA模型进行预测得到的预测结果记为Skij,Skij为包含1行m列的向量,k=1,2,…,20;
3-4、将Skij中的1行m列数据作为第i种等级中第j个茶叶样本的排序差异总和矩阵Sij的第k行数据,构建得到Sij,Sij为20行m列的矩阵;
步骤4、构建m种不同等级中每个茶叶样本的排序差异总和标准参考序列向量,具体构建过程为:
4-1、将第i种等级中第j个茶叶样本的排序差异总和标准参考序列向量记为Bij
4-2、获取Sij中每行数据中的最大值,将Sij中第k行数据中的最大值作为Bij中第k行数据,得到Bij,Bij为20行1列的向量;
步骤5、构建第一索引值矩阵,将其记为B1,所述的第一索引值矩阵为包含20行1列索引值的矩阵,所述的第一索引值矩阵中第h行1列的索引值等于h,h=1,2,…,20;
步骤6、调整排序差异总和矩阵Sij中各行数据的行数,具体过程为:
6-1、根据Bij中包含的20行数据的大小对Bij中各行数据的行数进行调整,具体调整规则为:数据小的行数小,数据大的行数大,当出现两个或者多个相等的数据时,这几个相等的数据所处行数的大小按序随机确定即可,将调整后的Bij记为B1ij
6-2、根据B1ij对Sij中各行数据的行数进行调整,使B1ij中每行数据的行数与该行数据从Sij中获取时所处行数据的行数相等,由此得到调整后的Sij,将调整后Sij记为S1ij
步骤7、构建包含20行m列索引值的第二索引值矩阵,具体过程为:构建用于存放20个索引值的索引值列向量Cij,比较S1ij中位于第i列中20个数据的大小,按照以下方式设定S1ij中位于第i列中20个数据的索引值:
首先找到S1ij中位于第i列中20个数据中的最小数据,将最小数据的索引值设定为1,如果存在r个最小数据,r为大于等于2的整数,则这r个最小数据的索引值均设定为1,然后找到第二小的数据,将其索引值设定为r+1,如果存在t个第二小的数据,t为大于等于2的整数,则这t个第二小的数据的索引值均设定为r+1,接着找到第三小的数据,将其索引值设定为r+t+1,以此类推,直至找到最大数据完成最大数据的索引值设定;
将S1ij中位于第i列中20个数据的索引值存放到Cij中,且每个数据的索引值在Cij中所处行数等于该数据在S1ij所处行数,将Cij中的20行1列数据作为矩阵的第i列数据,最终得到包含20行m列索引值的第二索引值矩阵;
步骤8、将第二索引值矩阵中第i列索引值与第一索引值矩阵中1列数据的绝对差值之和记为SRDij,分别得到第二索引值矩阵中每列索引值与第一索引值矩阵中1列数据的绝对差值之和,共m个绝对差值之和SRD1j~SRDmj
步骤9、比较计算得到的SRD1j~SRDmj,找到其中的最小值,并确定计算得到该最小值的第二索引值矩阵中的一列索引值所对应的列数,该列数即为第i种等级中第j个茶叶样本所对应的茶叶等级;
步骤10、按照步骤2-步骤9的方法得到m种不同等级中每个茶叶样本的等级,然后将得到的第i种等级的茶叶样本的等级与其标注的等级Li进行比较,判定两者是否相同,从而完成m种不同等级中所有茶叶样本等级的快速鉴别。
CN201911111535.5A 2019-11-14 2019-11-14 一种基于偏最小二乘判别分析模型的茶叶等级判别方法 Active CN110954666B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911111535.5A CN110954666B (zh) 2019-11-14 2019-11-14 一种基于偏最小二乘判别分析模型的茶叶等级判别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911111535.5A CN110954666B (zh) 2019-11-14 2019-11-14 一种基于偏最小二乘判别分析模型的茶叶等级判别方法

Publications (2)

Publication Number Publication Date
CN110954666A CN110954666A (zh) 2020-04-03
CN110954666B true CN110954666B (zh) 2022-01-11

Family

ID=69977307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911111535.5A Active CN110954666B (zh) 2019-11-14 2019-11-14 一种基于偏最小二乘判别分析模型的茶叶等级判别方法

Country Status (1)

Country Link
CN (1) CN110954666B (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106560702A (zh) * 2016-10-20 2017-04-12 中国计量大学 联合电子舌和色谱分离技术的武夷岩茶产地鉴别方法
CN106560693A (zh) * 2016-10-20 2017-04-12 中国计量大学 基于偏最小二乘判别的武夷岩茶产地鉴别方法
CN106560694A (zh) * 2016-10-20 2017-04-12 中国计量大学 基于多种检验技术的武夷岩茶产地智能鉴别方法
CN107894408B (zh) * 2017-11-24 2021-04-13 中国农业科学院油料作物研究所 一种基于近红外光谱仪的食用油多元掺伪鉴别方法

Also Published As

Publication number Publication date
CN110954666A (zh) 2020-04-03

Similar Documents

Publication Publication Date Title
Boehm et al. The long and short (run) of trade elasticities
Stone et al. Selection of biological indicators appropriate for European soil monitoring
Boldt et al. The impact of evidence reliability on sensitivity and bias in decision confidence.
Iacobucci et al. A meditation on mediation: Evidence that structural equations models perform better than regressions
Besedeš A search cost perspective on formation and duration of trade
US9384603B2 (en) Failure cause classification apparatus
WO2006132759A3 (en) Method and apparatus for candidate evaluation
Alkhasawneh et al. Modeling student retention in science and engineering disciplines using neural networks
CN106560692A (zh) 联合四种检验技术的武夷岩茶产地鉴别方法
Edriss et al. Genomic prediction in a large African maize population
Kalogiouri et al. Liquid chromatographic methods coupled to chemometrics: A short review to present the key workflow for the investigation of wine phenolic composition as it is affected by environmental factors
Levin et al. Phased narrowing: A new process tracing method for decision making
CN110689091A (zh) 弱监督细粒度物体分类方法
Battisti et al. Labor productivity and firm-level TFP with technology-specific production functions
CN107016122A (zh) 基于时间迁移的知识推荐方法
Brock Unfair inequality, governance and individual beliefs
CN114741603A (zh) 基于用户聚类和商品聚类的混合协同过滤推荐算法
CN110954666B (zh) 一种基于偏最小二乘判别分析模型的茶叶等级判别方法
Wu et al. Automated modal identification based on improved clustering method
Zeng et al. Evaluation and analysis model of wine quality based on mathematical model
JP3778177B2 (ja) 物体検査装置
CN111612260A (zh) 基于集成学习模型的轨道交通车载数据预测方法
CN112365302B (zh) 产品推荐网络的训练方法、装置、设备及介质
Meeng et al. Rocsearch—an roc-guided search strategy for subgroup discovery
Fitousi Can we perceive two colors at the same time? A direct test of Huang and Pashler’s (2007) Boolean map theory of visual attention

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant