CN109657733A

CN109657733A - 基于成分结构特征的品种鉴别方法与系统

Info

Publication number: CN109657733A
Application number: CN201811631853.XA
Authority: CN
Inventors: 陈志军; 刘艳; 张蕾
Original assignee: Institute of Agricultural Quality Standards and Testing Technology for Agro Products of CAAS
Current assignee: Institute of Agricultural Quality Standards and Testing Technology for Agro Products of CAAS
Priority date: 2018-12-28
Filing date: 2018-12-28
Publication date: 2019-04-19
Anticipated expiration: 2038-12-28
Also published as: CN109657733B

Abstract

本发明提供了一种基于成分结构特征的品种鉴别方法与系统，涉及品种鉴别技术领域，该方法包括获取待鉴别样本中所含目标成分物质的含量数据；将该含量数据转化为相对百分比闭合结构特征的成分数据；根据该成分数据建立样本指标矩阵；将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；根据该新样本指标矩阵鉴别待鉴别样本的品种，获得待鉴别样本的鉴别正确率。本发明实施例提供的基于成分结构特征的品种鉴别方法与系统，可以更加客观和可靠地鉴别物质品种，有效提高鉴别准确率。

Description

基于成分结构特征的品种鉴别方法与系统

技术领域

本发明涉及品种鉴别技术领域，尤其是涉及一种基于成分结构特征的品种鉴别方法与系统。

背景技术

品种鉴定是对人工选择的、具有一定区域分布与成分特征的群体进行评定的过程。

现实中成分数据是普遍存在的，如经济学中的产业构成数据、地质学中的岩石成分数据、各年龄段人口的比例数据、油料作物中不同脂肪酸含量占比数据等等。与常规数据相比，成分数据在分析应用上有自身的独特优势，例如：成分数据能够反映数据与数据间的相对关系；成分数据中不同指标变量间的相互约束关系可以增强模型结构的整体性，有利于对整体性特征进行综合分析，同时，也有利于进一步剖析指标变量间的结构性、差异性、关联性等特征。

目前，尚没有利用物质的成分结构特征对物质的品种进行鉴别的方法。

发明内容

有鉴于此，本发明的目的在于提供一种基于成分结构特征的品种鉴别方法与系统，可以通过待鉴别样本的目标成分物质的结构特征对品种进行鉴别，更加客观和可靠的鉴别物质品种，提高鉴别准确率。

第一方面，本发明实施例提供了一种基于成分结构特征的品种鉴别方法，包括：获取待鉴别样本中所含目标成分物质的含量数据；将该含量数据转化为相对百分比闭合结构特征的成分数据；根据该成分数据建立样本指标矩阵；将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；根据该新样本指标矩阵鉴别待鉴别样本的品种，获得待鉴别样本的鉴别正确率。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，在上述根据该新样本指标矩阵鉴别该待鉴别样本的品种，获得该待鉴别样本的鉴别正确率的步骤之后，还包括：根据该新样本指标矩阵，应用交叉验证法获得该待鉴别样本的平均鉴别正确率。

结合第一方面的第一种可能的实施方式，本发明实施例提供了第一方面的第二种可能的实施方式，其中，上述将该含量数据转化为相对百分比闭合结构特征的成分数据的步骤，包括：应用闭合运算法，将待鉴别样本所含目标成分物质的含量数据转化为单个成分物质含量占总含量的百分比数据；根据该百分比数据构造反映该目标成分物质结构特征的成分数据。

结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，上述根据该成分数据建立样本指标矩阵的步骤，包括：依据检出限LOD值，运用稳健极大似然估计方法，对该样本指标矩阵中的未检出值进行估计，得到估计数据；用该估计数据替换该未检出值，以建立完整的样本指标矩阵。

结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，上述将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵的步骤，包括：应用等距对数比转换法将该样本指标矩阵从单形空间转换到欧几里得空间得到新样本指标矩阵。

结合第一方面的第一种可能的实施方式，本发明实施例提供了第一方面的第五种可能的实施方式，其中，上述根据该新样本指标矩阵鉴别该待鉴别样本的品种，获得该待鉴别样本的鉴别正确率的步骤，包括：对该新样本指标矩阵进行数据标准化处理；根据该数据标准化处理后的新样本指标矩阵，运用正交偏最小二乘判别法，基于费希尔判别准则获得该待鉴别样本的品种鉴别结果；根据该品种鉴别结果获取该待鉴别样本的鉴别正确率。

结合第一方面的第五种可能的实施方式，本发明实施例提供了第一方面的第六种可能的实施方式，其中，上述应用交叉验证法获得该待鉴别样本的平均鉴别正确率的步骤，包括：依据该数据标准化处理后的新样本指标矩阵建立K个K-折交叉验证样本；运用正交偏最小二乘判别法获取每个该K-折交叉验证样本的鉴别正确率；根据每个该K-折交叉验证样本的鉴别正确率获得平均鉴别正确率。

结合第一方面，本发明实施例提供了第一方面的第七种可能的实施方式，其中，该待鉴别样本为油菜籽，该目标成分物质为油酸。

第二方面，本发明实施例还提供了一种基于成分结构特征的品种鉴别系统，包括：数据获取模块，用于获取待鉴别样本中所含目标成分物质的含量数据；成分数据转化模块，用于将该含量数据转化为相对百分比闭合结构特征的成分数据；样本指标矩阵建立模块，用于根据该成分数据建立样本指标矩阵；新样本指标矩阵转换模块，用于将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；品种鉴别模块，用于根据该新样本指标矩阵鉴别待鉴别样本的品种，获得该待鉴别样本的鉴别正确率。

结合第二方面，本发明实施例还提供了第二方面的第一种可能的实施方式，其中，该系统还包括：鉴别结果验证模块，用于根据该新样本指标矩阵，应用交叉验证法获得待鉴别样本的平均鉴别正确率。

本发明实施例带来了以下有益效果：

本发明实施例提供的一种基于成分结构特征的品种鉴别方法与系统，该方法包括获取待鉴别样本中所含目标成分物质的含量数据；将该含量数据转化为相对百分比闭合结构特征的成分数据；根据该成分数据建立样本指标矩阵；将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；根据该新样本指标矩阵鉴别待鉴别样本的品种，获得待鉴别样本的鉴别正确率。本发明实施例提供的基于成分结构特征的品种鉴别方法，通过获取待鉴别样本的目标成分物质的结构特征，应用等距对数比转换去除样本矩阵中的冗余维度，对待鉴别样本的品种进行鉴别，可以更加客观和可靠地鉴别物质品种，有效提高鉴别准确率。

本公开的其他特征和优点将在随后的说明书中阐述，或者，部分特征和优点可以从说明书推知或毫无疑义地确定，或者通过实施本公开的上述技术即可得知。

为使本公开的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种基于成分结构特征的品种鉴别方法的流程图；

图2为本发明实施例提供的一种油菜籽品种鉴别方法的流程示意图；

图3为本发明实施例提供的一种基于成分结构特征的品种鉴别系统的结构示意图；

图4为本发明实施例提供的另一种基于成分结构特征的品种鉴别系统的结构示意图。

图标：

41-数据获取模块；42-成分数据转化模块；43-样本指标矩阵建立模块；44-新样本指标矩阵转换模块；45-品种鉴别模块；46-鉴别结果验证模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

成分数据普遍存在于现实生活中，然而，由于受“定和约束”的影响，成分数据中各个指标变量是完全相关的，针对常规数据的统计分析方法不适用于成分数据。这对成分数据的分析应用带来了很大困难：

(1)成分数据所张成的向量空间被称为单形空间，不同于常规的欧氏空间，其直观形态无法基于直角坐标系来描述。

在统计上，D维单形空间定义为：

上式中x被称为成分数据(Compositional Data)，是其约束条件，被称为“定和约束”，定和约束是成分数据的基本特征。对于样本中的某个指标变量而言，其携带的是一个相对信息，代表该指标占样本整体的比例。可以看出，成分数据是一类特殊的定和占比数据。

(2)成分数据的协方差矩阵是奇异的，且矩阵元素带有负偏性，其内在含义有别于常规数据的协方差矩阵。

(3)常规数据的统计分析大多建立在“多元正态分布”的假设基础上，而成分数据的统计建模工作缺乏类似的参数分布作为理论基础。

目前，尚没有利用物质的成分结构特征对物质的品种进行鉴别的方法，基于此，本发明实施例提供的一种基于成分结构特征的品种鉴别方法与系统，可以通过物质的成分数据对物质品种进行鉴别，更加客观和可靠的鉴别物质品种，提高鉴别准确率。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种基于成分结构特征的品种鉴别方法进行详细介绍。

实施例一：

如图1所示，为本发明实施例提供的一种基于成分结构特征的品种鉴别方法的流程图，由图1可见，该鉴别方法包括以下步骤：

步骤S102：获取待鉴别样本中所含目标成分物质的含量数据。

这里，待鉴别样本可以是各类植物种子、各类标本，也可以是其他客观存在的实物。物质是由成分构成的，通常一种物质含有多种成分，这里，选取待鉴别样本中的一种或多种成分物质作为目标成分物质。

在至少一种可能的实施方式中，可以通过成分检测方法，例如，通过光谱、色谱、能谱、热谱或质谱等技术来实现对待鉴别样本内部分析，达到确定其成分的目的，从而得到待鉴别样本的目标成分物质的含量数据。

步骤S104：将该含量数据转化为相对百分比闭合结构特征的成分数据。

在其中一种实施方式中，可以应用闭合运算法，将待鉴别样本所含目标成分物质的含量数据转化为单个成分物质含量占总含量的百分比数据；然后，根据该百分比数据构造反映上述目标成分物质结构特征的成分数据。

步骤S106：根据该成分数据建立样本指标矩阵。

通常情况下，在获取待鉴别样本的目标成分物质的成分数据之后，还会对该成分数据进行清洗，以剔除其中的高度特异值。

在实际操作中，受限于成分数据检测仪器的灵敏度，往往有部分成分的数据因其含量较低而无法检测出其成分含量，这部分数据称为未检出值，通常未检出值其结果显示为零。这里，在完成数据清洗之后，还可以依据检出限LOD值，运用稳健极大似然估计方法，对样本指标矩阵中的未检出值进行估计，得到估计数据；然后，用该估计数据替换上述未检出值，以建立完整的样本指标矩阵。

步骤S108：将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵。

在其中一种实施方式中，可以运用等距对数比转换法将样本指标矩阵中的样本点从单形空间转换到欧几里得空间，以去除样本指标矩阵中的冗余维度，得到新样本指标矩阵。

步骤S110：根据该新样本指标矩阵鉴别待鉴别样本的品种，获得待鉴别样本的鉴别正确率。

首先，对新样本指标矩阵进行数据标准化处理，这里，数据标准化包括中心化和归一化。

其次，以数据标准化处理后的新样本指标矩阵作为自变量，以待鉴别样本的品种名称作为分类变量，结合上述待鉴别样本的成分数据，应用正交偏最小二乘判别法(Orthogonal Partial least squares Discriminant Analysis，OPLS-DA)，并基于费希尔判别准则鉴别该待鉴别样本的品种，获得待鉴别样本的品种鉴别结果。这里，正交偏最小二乘判别法(OPLS-DA)是一种用于判别分析的多变量统计分析方法。判别分析是一种根据观察或测量到的若干变量值，来判断研究对象如何分类的常用统计分析方法。其原理是对不同处理样本(如观测样本、对照样本)的特性分别进行训练，产生训练集，并检验训练集的可信度。另外，费希尔判别准则(Fisher discrimination criterion)其思想是投影，使多维问题转化为低维问题来进行处理。选择一个适当的投影轴，使所用的样本点都投影到这个轴上得到投影值，使得同一类样本所形成的投影值的距离尽量的小，而不同类之间的投影值距离尽可能大。

然后，根据该品种鉴别结果获取待鉴别样本的鉴别正确率。

这样，根据待鉴别样本建立样本指标矩阵，通过空间矩阵转换去除样本矩阵中的冗余维度，并结合物质本身的成分结构特征对物质品种进行鉴别，实现了基于成分数据偏最小二乘判别技术的基于成分结构特征的品种鉴别方法。

本发明实施例提供的一种基于成分结构特征的品种鉴别方法，该方法包括获取待鉴别样本中所含目标成分物质的含量数据；将该含量数据转化为相对百分比闭合结构特征的成分数据；根据该成分数据建立样本指标矩阵；将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；根据该新样本指标矩阵鉴别待鉴别样本的品种，获得待鉴别样本的鉴别正确率；通过获取待鉴别样本的目标成分物质的结构特征，应用等距对数比转换去除样本矩阵中的冗余维度，对待鉴别样本的品种进行鉴别，可以更加客观和可靠地鉴别物质品种，有效提高鉴别准确率。

为了验证上述基于成分结构特征的品种鉴别方法的判别效果，在另一种可能的实施方式中，在获得待鉴别样本的鉴别正确率之后，还计算其平均鉴别正确率，也即，根据该新样本指标矩阵，应用交叉验证法获得该待鉴别样本的平均鉴别正确率。具体地，计算平均鉴别正确率的步骤包括：

(1)依据该数据标准化处理后的新样本指标矩阵建立K个K-折交叉验证样本；

(2)运用正交偏最小二乘判别法获取每个该K-折交叉验证样本的鉴别正确率；

(3)根据每个该K-折交叉验证样本的鉴别正确率获得平均鉴别正确率。

这里，K-折交叉验证通过对K个不同分组训练的结果进行平均来减少误差，因此模型的性能对数据的划分就不那么敏感。通常，K-折交叉验证包括以下步骤：

第一步，不重复抽样将原始数据随机分为-K份。

第二步，每一次挑选其中1份作为测试集，剩余K-1份作为训练集用于模型训练。

第三步，重复第二步-K次，这样每个子集都有一次机会作为测试集，其余机会作为训练集。在每个训练集上训练后得到一个模型，用这个模型在相应的测试集上测试，计算并保存模型的评估指标。

第四步，计算K组测试结果的平均值作为模型精度的估计，并作为当前K折交叉验证下模型的性能指标。

这里，还可以运用线性判别与PLS-DA等方法来计算待鉴别样本的鉴别正确率，但是，K-折交叉验证和OPLS-DA方法的效果更佳。

这样，即得到利用该基于成分结构特征的品种鉴别方法对待鉴别样本的品种进行鉴别的平均鉴别正确率，用于与传统品种鉴别方法的正确率进行比较分析。实际证明，本发明实施例提供的基于成分结构特征的品种鉴别方法具有更高的鉴别准确率。

实施例二：

在本实施例中，以油菜籽的品种鉴别为例，选取油菜籽中的油酸成分为目标成分物质，介绍了以上述实施例一中所提供的基于成分结构特征的品种鉴别方法对油菜籽的品种进行鉴别的过程，以更清楚理解上述基于成分结构特征的品种鉴别方法。

参见图2，为该油菜籽品种鉴别过程的流程示意图，其中，具体的步骤如下：

首先，获取油菜籽标准样，并了解数据背景，这里，数据背景包括样本的来源、采样和检测方法等。

然后，测定标准样中16种油酸的百分比含量，以根据该百分比含量数据建立样本指标矩阵。这里，依据检出限LOD值，运用稳健极大似然估计方法，对样本指标矩阵中的未检出值进行估计，得到估计数据，并用该估计数据替换未检出值，以建立完整的样本指标矩阵。

同时，获取不同品种油菜籽中油酸成分的构成特征，也即油菜籽中油酸成分的成分数据。对成分数据进行清洗，以剔除不合格值。并对未检出值进行估计，这里，运用imputeBDLS中lmrob方法(Templ，M.and Hron，K.and Filzmoser and Gardlo，A.2016年提出)进行未检出值估计。并且，对选取的不同品种的油菜籽的各项指标进行显著性检验。

接着，对清洗后的成分数据进行等距对数比转换(Isometric Log-RatioTransformation，ILR)，将样本指标矩阵中的样本点从单形空间转换到欧几里得空间，去除样本矩阵中的冗余维度，得到新样本指标矩阵。

其次，将上述转换后得到的新样本指标矩阵进行数据标准化处理，这里，将转换前后的两类数据分别进行标准化和结构化。

并且，将上述标准化后的数据进行整理，运用K-折交叉验证、OPLS-DA方法对数据进行运算，输出转换前和转换后的鉴别正确率、平均鉴别正确率。

最后，对转换前后两类数据的鉴别结果进行分析。

如此，即完成了对待检测油菜籽的品种鉴别，并可通过对转换前后两类数据的鉴别结果的比较，得到转换后的数据的鉴别结果准确率更高。

下面以一个实验实例对转换前后的鉴别结果进行比较说明。

在本实施例中，对14个油菜主产省市自治区生产的油菜籽产品质量安全状况进行了全面监测，样品覆盖全国油菜种植面积和产量的80％以上，共抽取代表性油菜籽样品1280份，对抽取的油菜籽样品按气相色谱法等方法标准进行了油酸成分的检测分析，包括以下16中指标：豆蔻酸C14:0、棕榈酸C16:0、棕榈一烯酸C16:1、十七碳烷酸C17:0、十七碳一烯酸C17:1、硬脂酸C18:0、油酸C18:1、亚油酸C18:2、亚麻酸C18:3、花生酸C20:0、花生一烯酸C20:1、花生二烯酸C20:2、山嵛酸C22:0、芥酸C22:1、二十四碳烷酸C24:0、二十四碳一烯酸C24:1，并按NY/T 1795-2009《双低油菜籽等级规格》对样品进行等级判定和统计分析。

其中，油酸成分的检出限为0.05％。

选取进行检测的油菜籽品种为：秦优10号(QY10，n＝44)、华油杂62(HYZ62，n＝31)。

基于上述两类样品中16种油酸的检测结果(含量百分比)进行ILR转换前后运用偏最小二乘鉴别品种鉴别正确率以及K-折平均正确率结果如下表所示：

	Members of sample	OPLS-DA	ILR-OPLS-DA
				QY10	44	97.73％	100％
HYZ62	31	83.87％	90.32％
				鉴别正确率		92％	96％
平均鉴别正确率		80.89％	86.57％

由上表可见，对于秦优10号以及华油杂62两个品种的油菜籽，其采用等距对数比转换(Isometric Log-Ratio Transformation，ILR)转换后的数据进行鉴别的正确率均高于未转换数据。可见，本发明实施例提供的基于成分结构特征的品种鉴别方法有效提高了鉴别准确率。

实施例三：

本发明实施例还提供了一种基于成分结构特征的品种鉴别系统，参见图3，为该系统的结构示意图，由图3可见，该系统包括依次相连的数据获取模块41，成分数据转化模块42，样本指标矩阵建立模块43，新样本指标矩阵转换模块44和品种鉴别模块45。这里，各个模块的功能如下：

数据获取模块41，用于获取待鉴别样本中所含目标成分物质的含量数据；

成分数据转化模块42，用于将该含量数据转化为相对百分比闭合结构特征的成分数据；

样本指标矩阵建立模块43，用于根据该成分数据建立样本指标矩阵；

新样本指标矩阵转换模块44，用于将该样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；

品种鉴别模块45，用于根据该新样本指标矩阵鉴别待鉴别样本的品种，获得该待鉴别样本的鉴别正确率。

在另一种实施方式中，如图4所示，该系统还包括鉴别结果验证模块46，其中，该鉴别结果验证模块46与品种鉴别模块45相连，该鉴别结果验证模块46用于根据该新样本指标矩阵，应用交叉验证法获得待鉴别样本的平均鉴别正确率。

本发明实施例所提供的基于成分结构特征的品种鉴别系统，其实现原理及产生的技术效果和前述基于成分结构特征的品种鉴别方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的基于成分结构特征的品种鉴别系统的具体工作过程，可以参考前述基于成分结构特征的品种鉴别方法实施例中的对应过程，在此不再赘述。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本发明的范围。

在这里示出和描述的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制，因此，示例性实施例的其他示例可以具有不同的值。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

本发明实施例所提供的进行基于成分结构特征的品种鉴别方法的计算机程序产品，包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于成分结构特征的品种鉴别方法，其特征在于，包括：

获取待鉴别样本中所含目标成分物质的含量数据；

将所述含量数据转化为相对百分比闭合结构特征的成分数据；

根据所述成分数据建立样本指标矩阵；

将所述样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；

根据所述新样本指标矩阵鉴别所述待鉴别样本的品种，获得所述待鉴别样本的鉴别正确率。

2.根据权利要求1所述的基于成分结构特征的品种鉴别方法，其特征在于，在所述根据所述新样本指标矩阵鉴别所述待鉴别样本的品种，获得所述待鉴别样本的鉴别正确率的步骤之后，还包括：

根据所述新样本指标矩阵，应用交叉验证法获得所述待鉴别样本的平均鉴别正确率。

3.根据权利要求1所述的基于成分结构特征的品种鉴别方法，其特征在于，所述将该含量数据转化为相对百分比闭合结构特征的成分数据的步骤，包括：

应用闭合运算法，将待鉴别样本所含目标成分物质的含量数据转化为单个成分物质含量占总含量的百分比数据；

根据所述百分比数据构造反映所述目标成分物质结构特征的成分数据。

4.根据权利要求1所述的基于成分结构特征的品种鉴别方法，其特征在于，所述根据所述成分数据建立样本指标矩阵的步骤，包括：

依据检出限LOD值，运用稳健极大似然估计方法，对所述样本指标矩阵中的未检出值进行估计，得到估计数据；

用所述估计数据替换所述未检出值，以建立完整的样本指标矩阵。

5.根据权利要求1所述的基于成分结构特征的品种鉴别方法，其特征在于，所述将所述样本指标矩阵转换到欧几里得空间得到新样本指标矩阵的步骤，包括：

应用等距对数比转换法将所述样本指标矩阵从单形空间转换到欧几里得空间得到新样本指标矩阵。

6.根据权利要求2所述的基于成分结构特征的品种鉴别方法，其特征在于，所述根据所述新样本指标矩阵鉴别所述待鉴别样本的品种，获得所述待鉴别样本的鉴别正确率的步骤，包括：

对所述新样本指标矩阵进行数据标准化处理；

根据所述数据标准化处理后的新样本指标矩阵，运用正交偏最小二乘判别法，基于费希尔判别准则获得所述待鉴别样本的品种鉴别结果；

根据所述品种鉴别结果获取所述待鉴别样本的鉴别正确率。

7.根据权利要求6所述的基于成分结构特征的品种鉴别方法，其特征在于，所述应用交叉验证法获得所述待鉴别样本的平均鉴别正确率的步骤，包括：

依据所述数据标准化处理后的新样本指标矩阵建立K个K-折交叉验证样本；

运用正交偏最小二乘判别法获取每个所述K-折交叉验证样本的鉴别正确率；

根据每个所述K-折交叉验证样本的鉴别正确率获得平均鉴别正确率。

8.根据权利要求1所述的基于成分结构特征的品种鉴别方法，其特征在于，所述待鉴别样本为油菜籽，所述目标成分物质为油酸。

9.一种基于成分结构特征的品种鉴别系统，其特征在于，包括：

数据获取模块，用于获取待鉴别样本中所含目标成分物质的含量数据；

成分数据转化模块，用于将所述含量数据转化为相对百分比闭合结构特征的成分数据；

样本指标矩阵建立模块，用于根据所述成分数据建立样本指标矩阵；

新样本指标矩阵转换模块，用于将所述样本指标矩阵转换到欧几里得空间得到新样本指标矩阵；

品种鉴别模块，用于根据所述新样本指标矩阵鉴别所述待鉴别样本的品种，获得所述待鉴别样本的鉴别正确率。

10.根据权利要求9所述的基于成分结构特征的品种鉴别系统，其特征在于，还包括：

鉴别结果验证模块，用于根据所述新样本指标矩阵，应用交叉验证法获得所述待鉴别样本的平均鉴别正确率。