CN105223164A

CN105223164A - 鉴别荞麦或燕麦粉掺假小麦粉的方法及系统

Info

Publication number: CN105223164A
Application number: CN201510468808.7A
Authority: CN
Inventors: 郭军; 张美莉; 李立民; 闫超; 刘莉敏; 张晶; 高玎玲; 顾翔宇; 木其尔
Original assignee: Inner Mongolia Agricultural University
Current assignee: Inner Mongolia Agricultural University
Priority date: 2015-08-04
Filing date: 2015-08-04
Publication date: 2016-01-06
Anticipated expiration: 2035-08-04
Also published as: CN105223164B

Abstract

本发明公开了一种鉴别荞麦或燕麦粉掺假小麦粉的方法及系统。鉴别荞麦或燕麦粉掺假小麦粉的方法包括：将麦粉样本划分为训练样本集和验证样本集，并分别进行NIR漫反射光谱指纹的采集。基于训练样本集的NIR漫反射光谱指纹建立多个鉴别模型；将验证样本集的NIR漫反射光谱指纹在鉴别模型中运行，确定鉴别模型的准确率，选择准确率满足要求的鉴别模型进行优化并返回继续确定优化后的准确率，并以准确率的提高程度判断模型优化的效果；用优化后的一个或多个鉴别模型对待检麦粉进行真实性鉴别。本发明能够可靠的对荞麦、燕麦中小麦掺假进行定性和定量分析，实用性强。

Description

鉴别荞麦或燕麦粉掺假小麦粉的方法及系统

技术领域

本发明涉及食品质量与安全检验技术领域，尤其涉及一种鉴别荞麦或燕麦粉掺假小麦粉的方法及系统。

背景技术

燕麦(莜麦)和荞麦营养丰富且具有保健功能，价格是小麦的2倍以上，因此很容易被掺入小麦面粉，从而使其特有的营养和保健功能大打折扣。从市场来看，燕麦和荞麦粉掺入小麦面粉或淀粉(据说在燕麦中掺入淀粉)的现状极为普遍，但由于掺入物为非有毒有害物质，并未引起消费者、有关部门、研究者和媒体的重视。这种掺假不仅仅使燕麦和荞面特有的营养和保健属性大打折扣，这种非法竞争会严重损害农民和正当经营者的利益，扰乱市场秩序，冒犯消费者和法律的尊严，败坏社会文明风气。目前尚无有效的、尤其是快速的检测方法可以对燕麦和荞麦真实性、纯度做出有效的评判，故而建立一种荞麦真实性判别方法十分有必要。

发明内容

鉴于此，本发明旨在提出一种鉴别荞麦或燕麦粉掺假小麦粉的方法及系统，基于本发明，可以更加准确地判别荞麦或燕麦的真实性。

第一方面，本发明公开了一种鉴别荞麦或燕麦粉掺假小麦粉的方法，包括如下步骤：步骤1，将收集的麦粉样本划分为训练样本集和验证样本集，所述训练样本集用于模型建立，所述验证样本集用于模型验证和优化；步骤2，对所述训练样本集，进行NIR漫反射光谱指纹的采集；步骤3，对所述训练样本集的NIR漫反射光谱指纹，用化学计量学软件进行数据结构分析，基于分析结果选择数据前处理和转换的方法，然后截取特征性光谱段，并选用化学计量学软件中的分析模块建立多个鉴别模型；步骤4，对所述验证样本集，也进行NIR漫反射光谱指纹的采集；步骤5，将所述验证样本集的NIR漫反射光谱指纹在所述鉴别模型中运行，对比模型的判别结果与所述验证样本集中每个已知样本的真实性是否一致，确定鉴别模型的准确率；步骤6，根据准确率的高低对鉴别模型进行排序，选择准确率满足要求的鉴别模型进行优化然后返回执行步骤5；并以准确率的提高程度判断模型优化的效果；步骤7，用优化后的一个或多个鉴别模型对待检麦粉进行真实性鉴别。

进一步地，上述鉴别荞麦或燕麦粉掺假小麦粉的方法中，所述NIR漫反射光谱指纹通过近红外光谱分析仪在800nm～2700nm的波长段获取。

进一步地，上述鉴别荞麦或燕麦粉掺假小麦粉的方法中，所述NIR漫反射光谱指纹通过近红外光谱分析仪在1100nm～2500nm的波长段获取。

进一步地，上述鉴别荞麦或燕麦粉掺假小麦粉的方法中，所述鉴别模型包括定性模型和/或定量模型；所述定性模型用于对荞麦或燕麦粉真实性进行判别；所述定量模型为对已明确的掺假对象进行掺加量计算的模型。

进一步地，上述鉴别荞麦或燕麦粉掺假小麦粉的方法中，所述步骤1中，所述训练样本集和所述验证样本集中的样本可以交叉。

进一步地，上述鉴别荞麦或燕麦粉掺假小麦粉的方法中，步骤6中，所述选择准确率满足要求的鉴别模型进行优化具体为：将验证样本集中的部分验证样本归入训练样本集，获得新的训练样本集；基于所述新的训练样本集，重新演算建模或修改模型参数，获得新的鉴别模型。

第二方面，本发明还提供了一种鉴别荞麦或燕麦粉掺假小麦粉的系统，包括：划分模块、第一采集模块、鉴别模型建立模块、第二采集模块、鉴别模型的准确率确定模块、优化模块和鉴别模块。其中，划分模块用于将收集的麦粉为荞麦或燕麦粉样本划分为训练样本集和验证样本集，所述训练样本集用于模型建立，所述验证样本集用于模型验证和优化；第一采集模块用于对所述训练样本集，进行NIR漫反射光谱指纹的采集；鉴别模型建立模块用于对所述训练样本集的NIR漫反射光谱指纹，用化学计量学软件进行数据结构分析，基于分析结果选择数据前处理和转换的方法，然后截取特征性光谱段，并选用化学计量学软件中的分析模块建立多个鉴别模型；第二采集模块用于对所述验证样本集，也进行NIR漫反射光谱指纹的采集；鉴别模型的准确率确定模块用于将所述验证样本集的NIR漫反射光谱指纹在所述鉴别模型中运行，对比模型的判别结果与所述验证样本集中每个已知样本的真实性是否一致确定鉴别模型的准确率；优化模块根据准确率的高低对鉴别模型进行排序，选择准确率满足要求的鉴别模型进行优化；并以准确率的提高程度判断模型优化的效果；鉴别模块用优化后的一个或多个鉴别模型对待检麦粉进行真实性鉴别。

本发明建立了一套可靠的，实用性强的荞麦、燕麦中小麦掺假的定性和定量方法和系统，可以用于国家食品质量与安全监督管理部门，食品检测分析实验室，粮食生产和加工企业用于原料和产品质量控制，以及打击社会上的掺假和造假现象。

此外，本方法用NIR光谱指纹正面描绘荞麦、燕麦和小麦的特征，因此除了小麦掺假，还能发现其他掺假引起的异常荞麦或燕麦。另外虽然模型的建立较为费时，但实用中，NIR分析属于快速和廉价的分析方法，甚至可以在现场操作，这是基于异种蛋白质和基因鉴别类方法不可媲美的。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本发明鉴别荞麦或燕麦粉掺假小麦粉的方法实施例的步骤流程图；

图2是本发明鉴别荞麦或燕麦粉掺假小麦粉的方法技术路线原理图；

图3A是本发明鉴别荞麦或燕麦粉掺假小麦粉的方法的一个实施例中，燕麦、苦荞与小麦NIR漫反射光谱指纹PCA分析图；

图3B是本发明鉴别荞麦或燕麦粉掺假小麦粉的方法的一个实施例中，纯甜荞与小麦NIR漫反射光谱指纹PCA分析图；

图4是本发明鉴别荞麦或燕麦粉掺假小麦粉的方法的一个实施例中，甜荞小麦掺入量的PLS定量模型示意图；以及

图5是本发明鉴别荞麦或燕麦粉掺假小麦粉的系统的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明拟以荞麦、燕麦和小麦粉，以及前两者掺入小麦粉样本在800nm～2700nm波长范围内的NIR漫反射光谱指纹为指标集，用化学计量学软件加以解析和建模，重点用偏最小二乘(PLS)多变量线性校正方法建立荞麦粉和燕麦粉中小麦粉掺假的定量鉴定方法，用偏最小二乘判别分析(PLS-DA)建立定性模型(不排除用PCA、SIMCA等建立定性鉴别模型)。该系列方法将具有检测成本低(廉价)，操作简便和快速的特点，可以在现场操作。该方法本质上是用NIR光谱指纹描绘荞麦、燕麦和小麦本身的“形象”和特征(模型、模式)，因此还可发现其他掺假引起的异常。

本发明在方法学和理念创新上，引入了光谱指纹库的建立、模型的建立、验证和优化成长的理念，提出了一种以NIR漫反射光谱指纹定量鉴别荞麦、燕麦中小麦掺假的方法。

下面，首先对本发明涉及的一些技术做出说明。

1、近红外光谱技术(NIR)

近红外光是指波长介于可见光与中红外光之间的电磁波，近红外光谱区被定义为780nm～2526nm。近红外光谱主要用于有机物的定性和定量分析。近红外光照射到物质后，会发生吸收、透射、散射、全反射和漫反射等几种相互作用形式。近红外光谱的采集方式主要有透射式、漫反射式和透漫射式三种，其中以透射和漫反射式较为常用。

近红外光谱指纹特征能反映物质分子中含氢基团(C-H、O-H、N-H)的种类和数量，随着样品内部成分组成的变化，其光谱特征也发生相应变化。

与传统分析方法相比，近红外光谱技术具有分析速度快和廉价的优点。具有样品无需前处理、不用试剂、不污染环境、适用的样品广、操作简单等优点。另外可实现全自动操作，可减少人工测试带来的随机误差，具有较高的精密度和重现性。

2、近红外光谱发展研究现状

国外近红外光谱的发展受到很大重视，广泛用于石油、制药、农业、医学和食品和饲料行业，主要用于营养和化学成分的快速检测。在掺假和品质鉴别方面，也用于快速鉴别方法的建立。DingHB等将近红外光谱技术和常规化学分析方法结合，采用多元线性回归鉴别了不同肉类，准确率在86％～100％，证明近红外光谱技术在物种鉴别方面的潜力。我国近红外光谱技术的发展研究与应用起步虽晚，但已受到很多方面的关注，在仪器研制、软件开发和应用等方面取得了优异的成果，尤其在农产品、药物、饮料、饲料和化工领域积累了很多实践经验。

张鑫等采用光谱预处理方法和建模方法建立了基于近红外技术的掺假生鲜乳识别平台，并进行了试验验证。周健等采用NIR技术实现了茶叶产地和品种的精确识别，最小二乘法建立的预模型能够准确地实现西湖龙井的真伪识别以及成品茶原料品种的产地识别，而且预测集样本的识别率达到100％和96.8％。

张萍等研究表明NIR光谱可鉴别苦荞中的甜荞掺假，但未涉及鉴别模型建立的理念，以及掺假量的定量分析。左旭等报道了用紫外光谱指纹鉴别苦荞粉掺假鉴别的可行性。

燕麦、甜荞掺假小麦的鉴别方法，尤其是掺假量的定量分析，未见报道。

荞麦、燕麦和小麦粉化学成分和理化特性的整体组合(即化学成分指纹和理化指标指纹)应该不同，但这种指纹上的差异(多变量的组合)用常规统计和演算无法解析，而且指标的实际检测工作量也很巨大。我们认为，理论上这些指纹的差异应该能表现在NIR光谱指纹中，用合适的数据处理和判别分析模块，就应该能进行一种面粉的物种真实性，甚至纯度(掺假量)的判别。

NIR光谱分析产生大量的数据，食物的NIR光谱必需依靠化学计量学原理和软件才能解析潜藏在光谱中的有用信息。化学计量学为基础的“指纹判别”

化学计量学(Chemometrics)为基础的“指纹鉴别技术”(fingerprintprofiling)或模式分析(patternrecognition)可为食物真实性鉴别提供一类新的理论、策略和方法。使无法直接辨别的数据指标集差异变得可以判别。

这类方法基本原理是以样品集的一组物理或化学测定指标(一组指标，而不是一个或少数几个，形象化称为“指纹”)为研究对象，用化学计量学分析原理抽取被检样品和已知样品的特征指标集(即“特征指纹”)，并演算出校正曲线或勾勒出二维或多维空间图形，以被检测样品与已知样品的“特征指纹”或“特征模型”的距离或相似度判断被测产品的品质或真实性，或以多变量校正曲线估算被测样品的纯正程度，或逻辑归类。化学计量学特征分析不仅能判别相似和差异，也能分析和找到造成差异的指标或因素。

模式判别(patternrecognition)和模型建立(modeling)是化学计量学的一个较高层次的应用，尤其国内在食物真实性鉴别领域尚无很好的研究和实践应用。采集已知样本集(训练样品)的某一方面指纹数据，找到特征模式建立鉴别模型，然后用这个模型判别未知样品是属于某个模型，即对未知样品的分类归属进行判别(用距离、相似度等)。目前食品领域最常用的分析模块有K最近邻(k-NN)、主成分分析(Principlecomponentanalysis，PCA)、偏最小二乘(Partialleastsquare，PLS)、软独立模式分类(SIMCA，一种基于PCA的模式分析方法)和偏最小二乘判别分析(PLS-DA)等。另外还有遗传算法、支持向量机和人工神经网络法等。目前化学计量学指纹特征或模式分析在食品研究设计中的应用还不是十分广泛，近年开始用于食物真实性鉴别技术的开发。成功案例如S.M.Ruth(2011)等成功地用类胡萝卜素指纹鉴别有机和非有机鸡蛋，她的团队在奶酪制作方法和产地，橄榄油产地和品质鉴别等方面也有突破。国内也开始应用化学计量学进行食品掺假的鉴别研究，但对荞麦和小麦物种真实性判别还未见报道。

偏最小二乘(Partialleastsquare，PLS)是一种多变量线性校正模块，如果研究对象聚类足够集中(不分散)，不同物质(如食物和掺假物质)聚类有明显的距离，则完可以用PLS和PLS-DA原理和方法建立定量或半定量鉴别模型。本发明将利用PLS和PLS-DA建立荞麦和燕麦中小麦掺假的定量鉴别和定性鉴别模型。

基于蛋白质和基因的检测物种鉴别技术

理论上也可采用基于蛋白质和基因(DNA、RNA)物种特异性的方法来鉴别荞麦和燕麦的小麦掺假，但目前尚未见这类报道。异种蛋白质和DNA污染的检测属于“排除法”逻辑或策略，即验证被检样品中有无其他物种蛋白质或基因的存在，不描绘食物本身应有的“形象”或特征。没有检测到某一种或几种外来蛋白质或基因，不能说受检产品就是真实的。

本方法用NIR光谱指纹正面描绘荞麦、燕麦和小麦的特征，因此除了小麦掺假，还能发现其他掺假引起的异常荞麦或燕麦。另外虽然模型的建立较为费时，但实用中，NIR分析属于快速和廉价分析方法。

本方法以燕麦粉(燕麦、莜面)、苦荞麦粉(苦荞)、甜荞麦粉(甜荞)和小麦面粉(小麦)的近红外(NIR)漫反射光谱(指纹)为指标集，通过化学计量学软件建立苦荞、甜荞面粉真实性的定量和定性鉴别方法。

本方法在方法学上是一类基于化学计量学的(Chemometrics)以NIR漫反射光谱指纹判别燕麦和荞麦物种真实性和纯度的鉴别方法。具体以燕麦、苦荞、甜荞和小麦在800nm～2700nm波长范围内的NIR特征性漫反射光谱为指标集，即“NIR光谱指纹”，用化学计量学软件分析光谱数据结构和规律，建立掺假量的PLS定量模型和基于定量的PLS-DA定性模型。

用到的化学计量学模块有主要有：主成分分析(PCA)，用于数据结构分析、聚类效果分析、测定误差分析等；偏最小二乘(Partialleastsquaies，PLS)，进行多变量线性校正，定量模型建立；偏最小二乘判别分析(PLS-DA)，建立定性模型。还可以用软独立模式分类(softindepententmodelingbyclassanalogy,SIMCA)和k-最近邻(k-nearestneighbor，k-NN)进行聚类和模式分析。还会用到各种光谱数据前处理和转换分析模块，譬如样本数据的标准正态变量变换(SNV),导数转换，傅立叶转换及变量的mean-centered、autoscale和pareto等等数据处理模块。

参照图1，图1为本发明鉴别荞麦或燕麦粉掺假小麦粉的方法实施例的步骤流程图，包括如下步骤：

步骤1，将收集的麦粉样本划分为训练样本集和验证样本集，训练样本集用于模型建立，验证样本集用于模型验证和优化；

步骤2，对训练样本集，进行NIR漫反射光谱指纹的采集；

步骤3，对训练样本集的NIR漫反射光谱指纹，用化学计量学软件进行数据结构分析，基于分析结果选择数据前处理和转换的方法，然后截取特征性光谱段，并选用化学计量学软件中的分析模块建立多个鉴别模型；

步骤4，对验证样本集，也进行NIR漫反射光谱指纹的采集；

步骤5，将验证样本集的NIR漫反射光谱指纹在鉴别模型中运行，对比模型的判别结果与验证样本集中每个已知样本的真实性是否一致，确定鉴别模型的准确率；

步骤6，根据准确率的高低对鉴别模型进行排序，选择准确率满足要求的鉴别模型进行优化然后返回执行步骤5；并以准确率的提高程度判断模型优化的效果；

步骤7，用优化后的一个或多个鉴别模型对待检麦粉进行真实性鉴别。

其中，NIR漫反射光谱指纹通过近红外光谱分析仪在1100nm～2500nm的波长段获取。

步骤1中，训练样本集和验证样本集中的样本可以适当交叉。

并且，步骤6中，选择准确率满足要求的鉴别模型进行优化具体为：将验证样本集中的部分验证样本归入训练样本集，获得新的训练样本集；基于新的训练样本集，重新演算建模或修改模型参数，获得新的鉴别模型。

参照图2，图2是本发明鉴别荞麦或燕麦粉掺假小麦粉的方法技术路线原理图，具体说明如下：

⑴燕麦、苦荞、甜荞和小麦面粉代表性样品集的收集，划分出训练样本集和验证样本集(两者可以适当交叉)，以训练样本集建立定性和定量模型，以验证样本集评价模型的准确性，优化和校正模型，使之更加稳健和准确。建立麦类真实性鉴别的通用模型，用于未知样品的初步鉴别；建立燕麦和小麦、苦荞和小麦、甜荞和小麦的定性鉴别和定量分析模型，以满足更细致的鉴别需要。

⑵样本NIR漫反射光谱指纹的采集。用一种NIR光谱分析仪多次扫描所有样本在800nm～2700nm波长段的漫反射光谱，并建立荞麦和小麦，以及其他麦类的NIR数据库。

⑶鉴别模型的建立和验证。用化学计量学软件的PCA模块对训练样本集的NIR光谱指纹进行结构和聚类情况的分析，如有必要进行合适的数据前处理和转换(后文进一步介绍)，然后截取特征性光谱段，选择合适的判别分析模块建立定性鉴别(如PLS-DA或SIMCA模型)和定量模型(PLS)。用已知的纯样本和掺假样本(验证样本集)验证和优化模型，使之更加稳健和准确。

⑷被检样本的判别，即模型的实用。将被检样品的NIR漫反射光谱数据放入软件的数据库中进行初步判别，如有必要进一步用两物种细分模型判别被检样品的真实性和小麦掺假量。

⑸该方法是学习成长型体系，随着实践样本量和NIR光谱指纹数据库的增加，可以不断优化或重建更稳健的模型。

本发明建立了一套可靠的，实用性强的荞麦、燕麦中小麦掺假的定性和定量方法，可以用于国家食品质量与安全监督管理部门，食品检测分析实验室，粮食生产和加工企业用于原料和产品质量控制，以及打击社会上的掺假和造假现象。

实例：

一、样本的采集和制备

采集足够量的燕麦、苦荞、甜荞和小麦面粉样品；划分为训练样本集和验证样本集。样品采集尽量具有代表性，覆盖不同品种或品系、种植地域、种植季节，但又不宜在一个农场、一个季节、一个加工厂重复采集过多的同质性样品。面粉均为80目或100目以上细粉。

建立定量模型，需要分别配制燕麦和小麦、甜荞和小麦的掺和样品。尽可能多地收集不同品种或产品类型的燕麦、荞麦和小麦，燕麦或荞面随机与一种小麦粉按照小麦粉0％(纯甜荞或燕麦)、10％、25％、50％、100％(纯小麦)的比例进行混合，即得到一个系列的掺假比例梯度混合样品(可以设置其他掺假比例和梯度)。

燕麦与小麦NIR光谱特征的差距远大于甜荞和小麦的差距，因此本申请以甜荞和小麦为实例。苦荞与小麦的差异也很大，且苦荞米粒产品多，制备成面粉的产品很少，苦荞中掺假小麦的可能性小，定性分析模型即可满足现实需要，无必要建立定量模型。

二、NIR漫反射光谱的采集和特征光谱段的选择

用近红外光谱分析仪进行NIR全波长段漫反射光谱扫描。NIR光谱仪的扫描波长最好较为宽阔，与可见光谱和红外光谱有适当的重叠，如选择可在800nm～2700nm波长区域扫描的机型，即研究型NIR分析仪为佳。经研究发现，可见光区对不同面粉的颜色和亮度敏感，但面粉的颜色和亮度与麦子的种类相关性不强，因此会增加模型的不稳健性。实际多选用1100nm～2500nm的波长段来建立模型，因此适用的NIR光谱仪厂家、品牌和机型较多。无论是在800nm～2700nm全波段扫描光谱，还是在1100nm～2500nm段的光谱，不一定全部用于模型的建立，要选择截取多个与麦类物种相关性密切的光谱波长段，才可建立对差异更加敏感的定量模型，这需要细致的数据结构分析。

用化学计量学软件对训练样本集的光谱指纹数据结构进行分析，往往要组合合适的光谱数据前处理(dataprocessing)或转换(datatransform)，还需要分析截取与样品聚类相关性较大的波长段建立定性和定量模型。数据处理，如mean-centered、autoscale和pareto等等，是对各波长漫反射数据的处理，即对数据表(矩阵)列变量数据的处理；数据转换，如标准正态变量变换(SNV)、傅立叶(Fourier)、一阶或二阶导数(1^stor2^ndDerivative)转换等等，是对各样本全谱的处理，即对数据表行变量的处理。一些高档的研究型NIR光谱仪所配备的工作站可能会提供多种光谱数据前处理和转换模块，但光谱指纹数据在专门的化学计量学软件(如Pirouette)上处理比较方便，可以随意组合不同的数据前处理、转换、聚类和模式分析模块进行数据结构分析和模型构建。

三、判别模型的建立和验证

⑴化学计量学软件

可采用各种专业化学计量学软件，如美国Infometrix公司的化学计量学专业软件Pirouette4.5，该版组合了最流行的化学计量学分析模块及数据预处理(Processing)和数据转换(Transform)模块。目前国际上有一些食品真实性的指纹鉴别研究(如SaskiavanRuth等，荷兰食品安全研究所RIKILT)方法的建立就是用这个软件完成的。

也可采用国际和国内同类化学计量学专业软件，或采用MABLAB中的多变量统计学模块。化学计量学方法和软件是一类实用且迅速发展演化的开放型方法和策略体系，各家开发的软件演算和逻辑原理、实用界面都有各自的特性，甚至有个性。

⑵具体可采用的主要演算和建模模块

可采用多种光谱数据结构分析、聚类和判别分析软件模块。如主成分分析PCA，用于数据结构特征分析、聚类情况分析，可行性预估，也可用于初步鉴别模型的建立；偏最小二乘分析(partialleastsquares，PLS)用于建立定量模型，偏最小二乘判别分析(PLS-DA)，是一种基于PLS原理的定性判别模块。也可以用软独立模式分类SIMCA(softindependentmodelingbyclassanalogy,目前中文翻译存在分歧，是一种基于PCA的判别分析模块)和K最近邻分析(k-NN)鉴定性分析模型。

⑶模型的验证和优化

用训练样本集建立的定量或定性模型，需要验证其判别的准确度。将验证样本集的NIR光谱指纹数据放入化学计量学软件的数据库中，用模型确定的数据前处理、转换、光谱段截取、距离或相似度演算方法，或多变量线性模型进行数据处理和演算，根据参数软件自动进行逻辑判断或给出掺假量计算结果。用验证样本集样本数量和正确判别结果数量计算判别的准确度。

验证样本集可划分为内部验证样本和外部验证样本。前者为建立模型时使用过的样本，重新放入模型进行判别，结果应该100％正确，否则模型不准确，不可实用；外部验证样本集为建立模型时未使用过的已知样本集，理论上样本量越大，验证结果越准确。实践中验证可以不断进行，如果模型对一些已知样品有误判，则应将这些样本纳入训练样本集，对模型进行优化或重建。因此理论上本方法体系是一个不断学习和升级的体系，但模型最终会达到一个最理想的状态。尤其是一些指纹特征突出，分类不多的判别，如小麦和燕麦、荞面的二分类判别，较容易达到100％准确的判断。

对多变量线性模型定量测定小麦掺假量来说，由于每一种麦类本身具有多样性，如品系多、加工精度差异大(不同出粉率)，因此对小麦掺假量定量测定的准确度不能期望太高，±10％以内的准确度即可，譬如掺入一半小麦面粉的甜荞面，测定结果可以在40％～60％之范围内。

⑷具体策略的补充说明

①甜荞和燕麦的小麦掺假鉴别，是二分类鉴别，分别建立鉴别模型即可。定量模型用PLS建立，定性则PLS-DA会很准确，也可实用kNN、SIMCA和PCA等。

②关于数据前处理和转换，波长段的截取，以及模型的选择，遵循简单的原则，验证的原则。譬如本文实例，用原始数据进行PCA分析，即可划分燕麦、苦荞、甜荞和小麦，因此就不必进行光谱数据的处理；PLS定量模型的建立中，对800nm～2700nm波长段没有进行截取，即获得了较为理想的定量分析模型。如果更细致的数据处理、波长截取、模块参数选择，没有实质性的提高模型的准确度则不必采用这类操作。复杂的步骤即便获得更明朗或漂亮的模型，但在实际应用中模型可能反而会不稳定(如过分雕琢的弓弩，可能易裂折)，因此需要经过多次验证和校正，并在实践中不断改进。

③异常样品和过多同质的样品，会破坏模型的稳健。因此异常样品一定要剔除，或探明异常的原因；样品采集尽量具有代表性，不宜从一个农场、一个季节、一个加工厂采集过多的同质性样品。

⑸模型的兼容性和升级

样本原始NIR全波段光谱库、通用模型和各二分类判别模型可以统一打包，可配合同厂家不同型号NIR光谱分析仪器使用。对另外厂家的NIR光谱指纹库(与建模NIR光谱仪不同)，需要额外的过滤软件进行过滤处理，进行波长点对齐，使其具有兼容和一致性。

⑹指纹数据库和模型的成长性

该方法是学习成长型体系，随着实践样本量和NIR光谱指纹数据库的增加，可以不断优化或重建更稳健的模型。

四、掺假的鉴别和掺加量的计算

扫描被检样品的NIR漫反射光谱指纹数据，放入化学计量学软件的数据库中，选择一种建好的模型，模型会自动对被检样品的光谱指纹进行模型固定方式的数据处理、转换、光谱波长段截取，距离或相似度演算或定量计算，最后模型自动给出逻辑判断结果或掺假量计算结果。

五、数据分析、建模和验证举例

5.1NIR光谱指纹的PCA分析

用甜荞、苦荞、燕麦、纯小麦和掺入小麦的甜荞(标记为甜荞)组成训练样本集，对原始NIR全波长段(800nm～2700nm)光谱进行主成分分析(PCA)，结果见图3A和图3B。结果表明甜荞、苦荞、燕麦和小麦粉的NIR光谱指纹特性有显著的差异，因此可使样本以NIR光谱特征聚类到三维空间的不同区域，足以说明NIR光谱指纹完全可以建立准确稳健的定量鉴定模型。

图3A，燕麦、苦荞与小麦聚类距离很远(各5个样本)，纯甜荞和掺入不同计量小麦的甜荞也与小麦呈现了分离趋势，纯甜荞样品(5个样本，A图上方虚线圈定)与小麦聚类也很远。

图3B，纯甜荞与小麦分布在不同的相区(虚线分开)，3个掺入大量小麦的样品落在小麦的附近，但聚类还是有明显的分离趋势。

5.2PLS多变量线性模型

五个甜荞样品，随机组合掺入五个小麦样品，制备训练样本集，建立小麦掺入量的PLS定量模型。小麦掺入量梯度：0％(纯甜荞)、10％、25％、50％、100％(纯小麦)样本NIR全波长漫反射光谱数据经过2ndDerivative和SNV转换，进行PLS多变量线性校正，获得的定量分析曲线如图4所示。

结果：获得了较为理想的PLS定量模型，参照图4，5个掺假比例梯度的样品点较为集中，说明误差较小。如果对NIR光谱进行适当的选择截取，可以获得更好的校正曲线。

根据样品的分散范围，估计的计算误差为±5％，验证样本集(每个掺假梯度2个样品)总相对标准偏差(RSD)为4.6％。这个结果十分理想，虽然模型尚未经过麦类物种相关性强光谱段截取等优化，但考虑本次训练样本集较小，因此最保守估计，实际应用中的计算误差不会超过±10％。

5.3甜荞和小麦的PLS-DA二分类鉴别模型

用上述训练样本集建立PLS-DA模型。纯甜荞设为1类，掺入小麦的甜荞和纯小麦设为2类。

验证样本集：纯甜荞外部样品7个，内部样品5个；纯小麦5个外部样品，5个内部样品；小麦掺入量为10％、25％和50％的样品每个掺入量各5个样品，全部为内部样品。用PLD-DA模型进行掺假的判别分析。

模型的验证结果：12个纯甜荞全部被判别为1类，掺假样品和纯小麦全部判别为2类，即判别结果100％准确。考虑到本次预实验验证样本集较小，在今后以及实践应用中该模型有待进一步考验和优化。

由此可见，本实施例建立了一套可靠的，实用性强的荞麦、燕麦中小麦掺假的定性和定量方法，可以用于国家食品质量与安全监督管理部门，食品检测分析实验室，粮食生产和加工企业用于原料和产品质量控制，以及打击社会上的掺假和造假现象。此外，本方法用NIR光谱指纹正面描绘荞麦、燕麦和小麦的特征，因此除了小麦掺假，还能发现其他掺假引起的异常荞麦或燕麦。另外虽然模型的建立较为费时，但实用中，NIR分析属于快速和廉价的分析方法，甚至可以在现场操作，这是基于异种蛋白质和基因鉴别类方法不可媲美的。

另一方面，参阅图5，本发明还公开了一种鉴别荞麦或燕麦粉掺假小麦粉的系统，包括：划分模块51、第一采集模块52、鉴别模型建立模块53、第一采集模块54、鉴别模型的准确率确定模块55、优化模块56和鉴别模块57。其中：

划分模块51用于将收集的麦粉样本划分为训练样本集和验证样本集，所述训练样本集用于模型建立，所述验证样本集用于模型验证和优化；所述麦粉为荞麦或燕麦粉；

第一采集模块52用于对所述训练样本集，进行NIR漫反射光谱指纹的采集；

鉴别模型建立模块53用于对所述训练样本集的NIR漫反射光谱指纹，用化学计量学软件进行数据结构分析，基于分析结果选择数据前处理和转换的方法，然后截取特征性光谱段，并选用化学计量学软件中的分析模块建立多个鉴别模型；

第一采集模块54用于对所述验证样本集，也进行NIR漫反射光谱指纹的采集；

鉴别模型的准确率确定模块55用于将所述验证样本集的NIR漫反射光谱指纹在所述鉴别模型中运行，对比模型的判别结果与所述验证样本集中每个已知样本的真实性是否一致，确定鉴别模型的准确率；

优化模块56根据准确率的高低对鉴别模型进行排序，选择准确率满足要求的鉴别模型进行优化；并以准确率的提高程度判断模型优化的效果；

鉴别模块57用优化后的一个或多个鉴别模型对待检麦粉进行真实性鉴别。

本发明鉴别荞麦或燕麦粉掺假小麦粉的系统与鉴别荞麦或燕麦粉掺假小麦粉的方法原理相似，对此不再赘述，相关之处，参照上述说明即可。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种鉴别荞麦或燕麦粉掺假小麦粉的方法，其特征在于，包括如下步骤：

步骤1，将收集的麦粉样本划分为训练样本集和验证样本集，所述训练样本集用于模型建立，所述验证样本集用于模型验证和优化；

步骤2，对所述训练样本集，进行NIR漫反射光谱指纹的采集；

步骤3，对所述训练样本集的NIR漫反射光谱指纹，用化学计量学软件进行数据结构分析，基于分析结果选择数据前处理和转换的方法，然后截取特征性光谱段，并选用化学计量学软件中的分析模块建立多个鉴别模型；

步骤4，对所述验证样本集，也进行NIR漫反射光谱指纹的采集；

步骤5，将所述验证样本集的NIR漫反射光谱指纹在所述鉴别模型中运行，对比模型的判别结果与所述验证样本集中每个已知样本的真实性是否一致，确定鉴别模型的准确率；

2.根据权利要求1所述的鉴别荞麦或燕麦粉掺假小麦粉的方法，其特征在于，

所述NIR漫反射光谱指纹通过近红外光谱分析仪在800nm～2700nm的波长段获取。

3.根据权利要求2所述的鉴别荞麦或燕麦粉掺假小麦粉的方法，其特征在于，

所述NIR漫反射光谱指纹通过近红外光谱分析仪在1100nm～2500nm的波长段获取。

4.根据权利2或3所述的鉴别荞麦或燕麦粉掺假小麦粉的方法，其特征在于，

所述鉴别模型包括定性模型和/或定量模型；

所述定性模型用于对荞麦或燕麦粉真实性进行判别；

所述定量模型为对已明确的掺假对象进行掺加量计算的模型。

5.根据权利要求4所述的鉴别荞麦或燕麦粉掺假小麦粉的方法，其特征在于，

所述步骤1中，所述训练样本集和所述验证样本集中的样本可以交叉。

6.根据权利要求5所述的鉴别荞麦或燕麦粉掺假小麦粉的方法，其特征在于，步骤6中，所述选择准确率满足要求的鉴别模型进行优化具体为：

将验证样本集中的部分验证样本归入训练样本集，获得新的训练样本集；

基于所述新的训练样本集，重新演算建模或修改模型参数，获得新的鉴别模型。

7.一种鉴别荞麦或燕麦粉掺假小麦粉的系统，其特征在于，包括：

划分模块，用于将收集的麦粉为荞麦或燕麦粉样本划分为训练样本集和验证样本集，所述训练样本集用于模型建立，所述验证样本集用于模型验证和优化；

第一采集模块，用于对所述训练样本集，进行NIR漫反射光谱指纹的采集；

鉴别模型建立模块，用于对所述训练样本集的NIR漫反射光谱指纹，用化学计量学软件进行数据结构分析，基于分析结果选择数据前处理和转换的方法，然后截取特征性光谱段，并选用化学计量学软件中的分析模块建立多个鉴别模型；

第二采集模块，用于对所述验证样本集，也进行NIR漫反射光谱指纹的采集；

鉴别模型的准确率确定模块，用于将所述验证样本集的NIR漫反射光谱指纹在所述鉴别模型中运行，对比模型的判别结果与所述验证样本集中每个已知样本的真实性是否一致，确定鉴别模型的准确率；

优化模块，根据准确率的高低对鉴别模型进行排序，选择准确率满足要求的鉴别模型进行优化；并以准确率的提高程度判断模型优化的效果；

鉴别模块，用优化后的一个或多个鉴别模型对待检麦粉进行真实性鉴别。