CN116721714A

CN116721714A - 一种配方产品感官质量的数字化评估方法

Info

Publication number: CN116721714A
Application number: CN202310586222.5A
Authority: CN
Inventors: 宫会丽; 杨宁; 秦玉华
Original assignee: Ocean University of China
Current assignee: Ocean University of China
Priority date: 2023-05-22
Filing date: 2023-05-22
Publication date: 2023-09-08

Abstract

本发明公开了一种配方产品感官质量的数字化评估方法，包括：利用m个配方产品的测量数据作为训练样本，建立训练样本矩阵X；结合专家对训练样本的品评结果，建立专家感官品评向量Y；将测试样本x_m+1加入训练样本矩阵X，形成集合X^(m+1)；根据专家感官品评向量Y中的感官指标的个数为测试样本x_m+1分配相同个数的感官指标；根据集合X^(m+1)中样本之间的距离，采用相似性度量方法表达样本之间的分布差异；根据测试样本与训练样本之间的分布差异，选择分布相似程度最高的训练样本的感官指标的评估值预测所述测试样本x_m+1的感官指标评估值。本发明的感观质量评估方法简单有效，评估结果不受人为主观因素影响，可信度高。

Description

一种配方产品感官质量的数字化评估方法

技术领域

本发明属于产品质量检测技术领域，具体地说，是涉及一种针对配方产品的感官质量进行数字化评估的方法。

背景技术

在传统的具有感官评估特征的配方行业中，产品质量评估主要依靠品评专家的个人经验来完成。例如，在啤酒、卷烟、饮料、食品等行业，品评专家不仅需要具有大量的行业背景知识和丰富的品评经验，而且还要求品评专家能够在很短的时间内捕捉到产品中的诸多特征，例如色、香、味、泡沫等，并对其进行评定。

但是，组织品评专家对产品质量感官特征进行评估的过程繁琐且成本高，尤其专家经验性评估结果受专家固有的主观爱好、生理差异、身体状态、心理状态影响较大，同时也会对品评专家的身体造成损害，且不适用于对大批量样本的感官评价。因此，设计一种更加客观、快速、数字化的感官质量评价方法，已成为配方行业的迫切需求。

目前具有感官评估特征的数字化配方设计行业，研究者通常会利用产品检测化学成分信息与感官评估指标建立数字化模型。例如，在啤酒行业，企业会先检测出啤酒样品的化学成分，例如啤酒的碳水化合物、含氮物质、矿物质及微量元素等，然后与色、香、味、泡沫等感官指标建立某种关系，确定数学模型。但实际上，受企业检测条件和检测速度、成本等因素的限制，往往仅能给出几个常规的检测指标，而利用仅有的几个常规检测指标与感官指标之间建立起的数学模型，其准确性较低，因此，无法达到专家评估的效果。

发明内容

本发明的目的在于提供一种配方产品感官质量的数字化评估方法，以解决传统的专家品评方法受主观因素影响严重、现有的数字化评估方法准确性低的问题。

为解决上述技术问题，本发明采用以下技术方案予以实现：

一种配方产品感官质量的数字化评估方法，包括：

利用m个配方产品的测量数据作为训练样本，建立训练样本矩阵X；

根据专家品评结果，对训练样本矩阵X中的每一个训练样本的感官指标赋予评估值，建立专家感官品评向量Y；

在对测试样本x_m+1进行感官指标评估时，将测试样本x_m+1加入训练样本矩阵X，形成集合X^(m+1)；

根据专家感官品评向量Y中的感官指标的个数为测试样本x_m+1分配相同个数的感官指标；

根据集合X^(m+1)中样本之间的距离，采用相似性度量方法表达样本之间的分布差异；

根据测试样本与训练样本之间的分布差异，选择分布相似程度最高的训练样本的感官指标的评估值预测所述测试样本x_m+1的感官指标评估值。

在本申请的一些实施例中，所述采用相似性度量方法表达样本之间的分布差异的过程可以包括：

利用所述训练样本矩阵X和专家感官品评向量Y构建一个训练样本序列Z^(m)：

Z^(m)＝(z₁，z₂，...，z_m)；z_i＝{(x_i，y₁)，(x_i，y₂)，...(x_i，y_k)，...，(x_i，y_s)}；i＝(1，2，...，m)；

其中，x_i表示第i个训练样本；(x_i，y_k)中的y_k表示第i个训练样本x_i的第k个感官指标；s为感官指标的总个数；

计算训练样本序列Z^(m)中每一个样本Z_i的相似性度量值；

构建测试样本x_m+1的检验样本z_m+1：

z_m+1＝{(x_m+1，y₁)，(x_m+1，y₂)，...，(x_m+1，y_s)}；

将检验样本z_m+1加入训练样本序列Z^(m)，构成检验样本序列Z^(m+1)：

Z^(m+1)＝(z₁，z₂，...，z_m，z_m+1)；

计算检验样本序列Z^(m+1)中，检验样本Z_m+1与训练样本之间的相似性度量值。

在本申请的一些实施例中，所述计算训练样本序列Z^(m)中每一个样本Z_i的相似性度量值的过程可以包括：

从训练样本序列Z^(m)中，选取感官指标y_k＝u的训练样本形成同类别样本序列，选取感官指标y_k≠u的训练样本形成不同类别样本序列；其中，u为感官指标y_k的评估值；

结合同一感官指标y_k的同类别样本序列和不同类别样本序列，计算每一个训练样本的相似性度量值，计算方法如下：

其中，表示训练样本x_i在其第k个感官指标y_k的评估值为u时与其它训练样本之间的相似性度量值；k＝1，2，...，s；u＝1，2，...，h；v为y_k＝u的训练样本的总个数，且v＜m；公式中，分子表示与z_i具有同类别且最短距离的c个训练样本到z_i的距离之和；分母表示与z_i具有不同类别且最短距离的c个训练样本到z_i的距离之和；c为整数，自行设定。

在本申请的一些实施例中，所述计算检验样本序列Z^(m+1)中，检验样本Z_m+1与训练样本之间的相似性度量值的过程可以包括：

分别为测试样本x_m+1的每一个感官指标赋予不同的评估值；

分别计算测试样本x_m+1在每一个感官指标等于不同的评估值时，检验样本z_m+1与训练样本之间的相似性度量值，计算方法如下：

其中，表示测试样本x_m+1在其第k个感官指标y_k的评估值为u时与训练样本之间的相似性度量值；公式中，分子表示与z_m+1具有同类别且最短距离的c个训练样本到z_m+1的距离之和；分母表示与z_m+1具有不同类别且最短距离的c个训练样本到z_m+1的距离之和。

在本申请的一些实施例中，所述测试样本x_m+1的感官指标评估值的预测方法可以包括：

计算检验样本z_m+1＝{(x_m+1，y₁)，(x_m+1，y₂)，...，(x_m+1，y_s)}中每一个组合的随机性检验Q_k值：

其中，分子表示集合中元素满足要求的个数；

选择Q_k值中的最大值所对应的评估值u，作为测试样本的第k个感官指标y_k的评估值，其公式表达为：

CL_K＝MAX(Q_k)；

其中，CL_K即为测试样本x_m+1的第k个感官指标y_k的评估值。

在本申请的一些实施例中，在形成所述集合X^(m+1)时，首先对集合X^(m+1)进行预处理，以减少干扰影响；然后，采用主成分分析法对预处理后的矩阵进行降维空间映射，以降低矩阵空间维度，生成降维后的主成分得分矩阵B^(m+1)：

其中，n为每一个样本的测量数据的个数；p为主成分个数，且p＜n；B_i为得分向量；W为载荷矩阵，表示主成分与对应原变量之间的相互关联程度，利用以下公式计算获得：

其中，λ_i为第i个样本的特征根，a_ij为第i个样本的第j个特征向量。

利用降维后的主成分得分矩阵B^(m+1)，计算所述集合X^(m+1)中样本之间的距离，可以解决采用一般方法难以有效预测其感观质量的问题。

在本申请的一些实施例中，优选采用马氏距离方法计算所述集合X^(m+1)中样本之间的距离。

在本申请的一些实施例中，为了获得配方产品中丰富的结构和组成信息，优选利用近红外光谱分析仪、质谱仪或者色谱仪获取训练样本和测试样本的光谱数据、质谱数据或色谱数据，形成样本的测量数据。

在本申请的一些实施例中，对所述集合X^(m+1)进行的预处理可以包括一阶导数、Norris平滑滤波以及PCA主成分预处理等。

在本申请的一些实施例中，所述建立专家感官品评向量Y的过程可以包括：

组织专家对m个训练样本分别进行品评，并针对每一个训练样本分别建立一个专家感官品评向量Y：

以等级或者档次的方式为每一个训练样本的每一个感观指标赋予评估值1、2、…、h。

与现有技术相比，本发明的优点和积极效果是：本发明利用配方产品的测试数据与其感官质量之间的内在关系，建立数字化评估模型；利用样本之间的距离，采用相似性度量方法表达样本之间的分布差异；根据测试样本与训练样本之间的分布差异，选择分布相似程度最高的训练样本的感官指标的评估值预测测试样本的感官指标评估值，方法简单有效，评估结果不受人为主观因素影响，可信度高。

结合附图阅读本发明实施方式的详细描述后，本发明的其他特点和优点将变得更加清楚。

附图说明

图1为本发明所提出的配方产品感官质量的数字化评估方法的一种实施例的总体流程图。

具体实施方式

下面结合附图对本发明的具体实施方式进行详细地描述。

具有感官评估特征的配方产品，其主体原料大多是农副产品，而非标准的工业制成品，因此，其内在属性信息难以实现清晰的数字化描述。同样地，对于配方产品而言，专家的品评感官难以量化表达，因此，也无法实现对所有感官特征的一一描述。

本实施例利用原料/产品属性信息与其感官质量之间的内在关系，采用科学求解方法建立映射关系，实现从输入空间到输出空间的映射：

以此来获得对产品感官质量的数字化评估。

由于近红外光谱中含有丰富的结构和组成信息，非常适合用于碳氢有机物质的组成性质表现，并且样品光谱中含有几千种样品，物质样品中80％～90％以上的有用信息能够在近红外光谱中有所表现。因此，本实施例摒弃传统的利用产品化学成分信息与感官指标之间建立数字化模型的方法，充分利用样品近红外光谱中丰富的特征信息，建立产品物理化学特征信息与感官指标之间的数字化表达关系，即，两者之间构建形成准确性更高的关系模型，并对模型预测结果进行可信度评价，为专家提供更全面的参考。

当然，对于企业的样品检测数据为质谱/色谱等高维检测数据的情况，同样也可以采用本实施例的建模方法及评估技术获得有效的感官评估结果。

当输入空间维度较高时，例如原料检测数据为质谱/色谱/近红外光谱等上千维的高维数据时，采用一般方法难以有效预测其感官质量，因此，本实施例针对高维检测数据，采用主成分分析法进行降维空间映射，以实现对配方产品感官质量的数字化评价。

下面结合图1，对本实施例的配方产品感官质量的数字化评估方法的具体设计过程进行详细阐述。

S101、构建训练样本矩阵X。

在本实施例中，可以从样本库中提取m个产品样本，作为训练样本，利用近红外光谱分析仪、质谱仪或者色谱仪获取m个训练样本的光谱数据、质谱数据或色谱数据，统称为测量数据。该测量数据通常为高维数据，数量可达上千个。

之后，对获取到的测量数据进行预处理，例如进行一阶导数、Norris平滑滤波以及PCA主成分预处理后，形成训练样本矩阵X：

其中，n为每一个训练样本的测量数据的个数，即，光谱点维度、质谱点维度或色谱点维度等，n的取值通常在2000～3000个左右。由此形成的训练样本矩阵X是一个m×n的高维空间矩阵。

S102、对训练样本矩阵X中的每一个训练样本的感官指标赋予评估值，建立专家感官品评向量Y。

其中，y_k表示第k个感官指标，s为感官指标的总个数。

以烟叶为训练样本为例，烟叶的感官指标通常包括5个，即，s＝5，分别为香气、谐调、杂气、刺激、余味。专家为每一个训练样本x_i的5个感官指标分别赋予评估值，以形成专家感官品评向量Y。

在本实施例中，每一个感官指标的评估值可以设置为1、2、…、h，即，以等级或者档次的方式定义感官指标的评估值。

S103、利用训练样本矩阵X和专家感官品评向量Y构建一个训练样本序列Z^(m)：

其中，x_i表示第i个训练样本；(x_i，y_k)中的y_k表示第i个训练样本x_i的第k个感官指标。

S104、当有一个测试样本x_m+1输入时，将测试样本x_m+1加入训练样本矩阵X，形成集合X^(m+1)：

X^(m+1)＝(x₁，x₂，...，x_m，x_m+1)。

S105、构建测试样本x_m+1的检验样本z_m+1：

z_m+1＝{(x_m+1，y₁)，(x_m+1，y₂)，...，(x_m+1，y_s)}。

本实施例为测试样本x_m+1也分配s个感官指标，至于每一个感官指标的评估值，可以根据测试样本与训练样本之间的分布差异，选择分布相似程度最高的训练样本的感官指标的评估值预测测试样本的感官指标评估值。

S106、将检验样本z_m+1加入训练样本序列Z^(m)，构成检验样本序列Z^(m+1)：

Z^(m+1)＝(z₁，z₂，...，z_m，z_m+1)。

S107、对集合X^(m+1)进行预处理，并采用主成分分析法对预处理后的矩阵进行降维空间映射，生成降维后的主成分得分矩阵B^(m+1)：

其中，p为主成分个数，且p＜n，通常p取小于100的值，在本实施例中可以配置p＝10；B_i为得分向量；W为载荷矩阵，表示主成分与对应原变量之间的相互关联程度，可以利用以下公式计算获得：

S108、根据主成分得分矩阵B^(m+1)，计算样本之间的距离。

在本实施例中，可以采用马氏距离方法计算样本之间的距离，其计算公式为：

其中，d_ij表示第i个样本与第j个样本之间的距离，i，j＝(1，2，...，m+1)。由此便可形成距离矩阵D：

S109、根据样本之间的距离，采用相似性度量方法表达检验样本序列Z^(m+1)中样本之间的分布差异。

首先，计算训练样本序列Z^(m)中每一个样本Z_i的相似性度量值，其具体方法是：

从训练样本序列Z^(m)中，选取感官指标y_k＝u的训练样本形成同类别样本序列，选取感官指标y_k≠u的训练样本形成不同类别样本序列。

例如，可以首先从训练样本序列Z^(m)中，选取第一个感官指标y₁＝1的训练样本构成一个同类别样本序列，选取第一个感官指标y₁≠1的训练样本构成一个不同类别样本序列；选取第一个感官指标y₁＝2的训练样本构成一个同类别样本序列，选取第一个感官指标y₁≠2的训练样本构成一个不同类别样本序列；以此类推，直到选取第一个感官指标y₁＝h的训练样本构成一个同类别样本序列，选取第一个感官指标y₁≠h的训练样本构成一个不同类别样本序列。然后，选取第二个感官指标y₂＝1的训练样本构成一个同类别样本序列，选取第二个感官指标y₂≠1的训练样本构成一个不同类别样本序列；……；选取第二个感官指标y₂＝h的训练样本构成一个同类别样本序列，选取第二个感官指标y₂≠h的训练样本构成一个不同类别样本序列。以此类推，选取第s个感官指标y_s＝1的训练样本构成一个同类别样本序列，选取第s个感官指标y_s≠1的训练样本构成一个不同类别样本序列；……；选取第s个感官指标y_s＝h的训练样本构成一个同类别样本序列，选取第s个感官指标y_s≠h的训练样本构成一个不同类别样本序列。

结合同一感官指标y_k的同类别样本序列和不同类别样本序列，计算每一个训练样本的相似性度量值计算方法如下：

其中，表示训练样本x_i在其第k个感官指标的评估值为u时与其它训练样本之间的相似性度量值；k＝1，2，...，s；u＝1，2，...，h；v为y_k＝u的训练样本的总个数，且v＜m，即，第k个感官指标的评估值为u的训练样本总个数；c为整数，可以自行设定；在上述相似性度量值/>公式中，分子表示与z_i具有同类别且最短距离的c个训练样本到z_i的距离之和(这些训练样本可以从y_k＝u的同类别样本序列中选取)，反映了相同类别的训练样本数据之间的相近似程度；分母表示与z_i具有不同类别且最短距离的c个训练样本到z_i的距离之和(这些训练样本可以从y_k≠u的不同类别样本序列中选取)，反映了不同类别的训练样本之间的疏散程度。

其次，计算检验样本序列Z^(m+1)中检验样本Z_m+1的相似性度量值，其具体方法是：

(1)分别为测试样本x_m+1的每一个感官指标赋予不同的评估值；

例如，针对测试样本x_m+1，对其第一个感官指标y₁分别赋予评估值1、2、h；对其第二个感官指标y₂分别赋予评估值1、2、h；以此类推，对其第s个感官指标y_s分别赋予评估值1、2、h。

(2)分别计算测试样本x_m+1在每一个感官指标等于不同的评估值时，检验样本z_m+1与训练样本之间的相似性度量值，计算方法如下：

其中，表示测试样本x_m+1在其第k个感官指标的评估值为u时与训练样本之间的相似性度量值。在上述相似性度量值/>公式中，分子表示与z_m+1具有同类别且最短距离的c个训练样本到z_m+1的距离之和，反映了相同类别的训练样本与测试样本之间的相近似程度；分母表示与z_m+1具有不同类别且最短距离的c个训练样本到z_m+1的距离之和，反映了不同类别的训练样本与测试样本之间的疏散程度。

S110、计算检验样本z_m+1＝{(x_m+1，y₁)，(x_m+1，y₂)，...，(x_m+1，y_s)}中每一个组合的随机性检验Q_k值。

随机性检验所需的Q_k值函数可以定义为：

其中，分子表示集合中元素满足要求的个数。即，上述公式表示感官指标y_k＝u时，训练样本之间的相似性度量值大于等于测试样本与训练样本之间的相似性度量值的个数与v+1的比值。

这样，对于测试样本x_m+1而言，其每一个感官指标均对应h个比值；即，Q₁中包括h个比值；Q₂中包括h个比值；……；Q_s中也包括h个比值。

Q_k值的大小反映了由检验样本z_m+1构成的检验样本序列Z^(m+1)符合独立同分布的可能性，也反映了该检验样本z_m+1属于y_k＝u的可能性大小。Q_k值越小，说明测试样本与训练样本之间的分布差异较大；Q_k值越大，说明测试样本与训练样本之间的分布相似程度越高。从另外一个角度，可以判断出测试样本属于y_k＝u的可能性概率。

S111、根据Q_k值，采用可信度评价方法确定测试样本的每一个感官指标的评估值。

在本实施例中，可以选择Q_k值中最大比值所对应的评估值u，作为测试样本的第k个感官指标y_k的评估值，其公式可以表达为：

CL_K＝MAX(Q_k)，k＝1，2，...，s；

其中，CL_K即为测试样本x_m+1的第k个感官指标y_k的评估值。

即，选择分布相似程度最高的训练样本的感官指标评估值预测测试样本的感官指标的评估值。

本实施例采用基于产品分析光谱/质谱/色谱信息的数字化感官评估，比传统的专家经验品评或者基于检测几个关键化学成分的数字化感官评价的准确性更高，更稳定，而且成本更低。

当然，以上所述仅是本发明的一种优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种配方产品感官质量的数字化评估方法，其特征在于，包括：

2.根据权利要求1所述的配方产品感官质量的数字化评估方法，其特征在于，所述采用相似性度量方法表达样本之间的分布差异的过程包括：

Z^(m)＝(z₁,z₂,…,z_m)；z_i＝{(x_i,y₁),(x_i,y₂),…(x_i,y_k),…,(x_i,y_s)}；i＝(1,2,…,m)；

其中，x_i表示第i个训练样本；(x_i,y_k)中的y_k表示第i个训练样本x_i的第k个感官指标；s为感官指标的总个数；

计算训练样本序列Z^(m)中每一个样本Z_i的相似性度量值；

构建测试样本x_m+1的检验样本z_m+1：

z_m+1＝{(x_m+1,y₁),(x_m+1,y₂),…,(x_m+1,y_s)}；

Z^(m+1)＝(z₁,z₂,…,z_m,z_m+1)；

3.根据权利要求2所述的配方产品感官质量的数字化评估方法，其特征在于，所述计算训练样本序列Z^(m)中每一个样本Z_i的相似性度量值的过程包括：

从训练样本序列Z^(m)中，选取感官指标y_k＝y的训练样本形成同类别样本序列，选取感官指标y_k≠u的训练样本形成不同类别样本序列；其中，u为感官指标y_k的评估值；

其中，表示训练样本x_i在其第k个感官指标y_k的评估值为u时与其它训练样本之间的相似性度量值；k＝1,2,…,s；u＝1,2,…,h；v为y_k＝u的训练样本的总个数，且v＜m；公式中，分子表示与z_i具有同类别且最短距离的c个训练样本到z_i的距离之和；分母表示与z_i具有不同类别且最短距离的c个训练样本到z_i的距离之和；c为整数，自行设定。

4.根据权利要求3所述的配方产品感官质量的数字化评估方法，其特征在于，所述计算检验样本序列Z^(m+1)中，检验样本Z_m+1与训练样本之间的相似性度量值的过程包括：

分别为测试样本x_m+1的每一个感官指标赋予不同的评估值；

5.根据权利要求4所述的配方产品感官质量的数字化评估方法，其特征在于，所述测试样本x_m+1的感官指标评估值的预测方法包括：

计算检验样本z_m+1＝{(x_m+1,y₁),(x_m+1,y₂),…,(x_m+1,y_s)}中每一个组合的随机性检验Q_k值：

其中，分子表示集合中元素满足要求的个数；

CL_K＝MAX(Q_k)；

其中，CL_K即为测试样本x_m+1的第k个感官指标y_k的评估值。

6.根据权利要求1至5中任一项所述的配方产品感官质量的数字化评估方法，其特征在于，在形成所述集合X^(m+1)时，对集合X^(m+1)进行预处理，并采用主成分分析法对预处理后的矩阵进行降维空间映射，生成降维后的主成分得分矩阵B^(m+1)：

其中，n为每一个样本的测量数据的个数；p为主成分个数，且p<n；B_i为得分向量；W为载荷矩阵，表示主成分与对应原变量之间的相互关联程度，利用以下公式计算获得：

根据主成分得分矩阵B^(m+1)，计算所述集合X^(m+1)中样本之间的距离。

7.根据权利要求6的配方产品感官质量的数字化评估方法，其特征在于，采用马氏距离方法计算所述集合X^(m+1)中样本之间的距离。

8.根据权利要求6的配方产品感官质量的数字化评估方法，其特征在于，每一个样本的测量数据是利用近红外光谱分析仪、质谱仪或者色谱仪获取到的样本光谱数据、质谱数据或色谱数据。

9.根据权利要求6的配方产品感官质量的数字化评估方法，其特征在于，对所述集合X^(m ⁺¹⁾进行的预处理包括一阶导数、Norris平滑滤波以及PCA主成分预处理。

10.根据权利要求1至5中任一项所述的配方产品感官质量的数字化评估方法，其特征在于，所述建立专家感官品评向量Y的过程包括：