CN116721714A - 一种配方产品感官质量的数字化评估方法 - Google Patents
一种配方产品感官质量的数字化评估方法 Download PDFInfo
- Publication number
- CN116721714A CN116721714A CN202310586222.5A CN202310586222A CN116721714A CN 116721714 A CN116721714 A CN 116721714A CN 202310586222 A CN202310586222 A CN 202310586222A CN 116721714 A CN116721714 A CN 116721714A
- Authority
- CN
- China
- Prior art keywords
- sensory
- sample
- training
- evaluation
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001953 sensory effect Effects 0.000 title claims abstract description 142
- 238000011156 evaluation Methods 0.000 title claims abstract description 105
- 238000012549 training Methods 0.000 claims abstract description 139
- 238000012360 testing method Methods 0.000 claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 33
- 238000005259 measurement Methods 0.000 claims abstract description 28
- 238000000691 measurement method Methods 0.000 claims abstract description 6
- 239000000203 mixture Substances 0.000 claims description 11
- 238000009472 formulation Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000002329 infrared spectrum Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 6
- 238000011524 similarity measure Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 230000009467 reduction Effects 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000012847 principal component analysis method Methods 0.000 claims description 4
- 238000001583 randomness test Methods 0.000 claims description 4
- 238000011208 chromatographic data Methods 0.000 claims description 3
- 238000009499 grossing Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 241001591024 Samea Species 0.000 abstract 1
- 238000001303 quality assessment method Methods 0.000 abstract 1
- 238000001514 detection method Methods 0.000 description 12
- 239000000126 substance Substances 0.000 description 7
- 238000001819 mass spectrum Methods 0.000 description 5
- 239000002994 raw material Substances 0.000 description 4
- 235000013405 beer Nutrition 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 239000006260 foam Substances 0.000 description 2
- 238000013178 mathematical model Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000013441 quality evaluation Methods 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- 206010013911 Dysgeusia Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 229910052500 inorganic mineral Inorganic materials 0.000 description 1
- 239000011707 mineral Substances 0.000 description 1
- 235000010755 mineral Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种配方产品感官质量的数字化评估方法,包括:利用m个配方产品的测量数据作为训练样本,建立训练样本矩阵X;结合专家对训练样本的品评结果,建立专家感官品评向量Y;将测试样本xm+1加入训练样本矩阵X,形成集合X(m+1);根据专家感官品评向量Y中的感官指标的个数为测试样本xm+1分配相同个数的感官指标;根据集合X(m+1)中样本之间的距离,采用相似性度量方法表达样本之间的分布差异;根据测试样本与训练样本之间的分布差异,选择分布相似程度最高的训练样本的感官指标的评估值预测所述测试样本xm+1的感官指标评估值。本发明的感观质量评估方法简单有效,评估结果不受人为主观因素影响,可信度高。
Description
技术领域
本发明属于产品质量检测技术领域,具体地说,是涉及一种针对配方产品的感官质量进行数字化评估的方法。
背景技术
在传统的具有感官评估特征的配方行业中,产品质量评估主要依靠品评专家的个人经验来完成。例如,在啤酒、卷烟、饮料、食品等行业,品评专家不仅需要具有大量的行业背景知识和丰富的品评经验,而且还要求品评专家能够在很短的时间内捕捉到产品中的诸多特征,例如色、香、味、泡沫等,并对其进行评定。
但是,组织品评专家对产品质量感官特征进行评估的过程繁琐且成本高,尤其专家经验性评估结果受专家固有的主观爱好、生理差异、身体状态、心理状态影响较大,同时也会对品评专家的身体造成损害,且不适用于对大批量样本的感官评价。因此,设计一种更加客观、快速、数字化的感官质量评价方法,已成为配方行业的迫切需求。
目前具有感官评估特征的数字化配方设计行业,研究者通常会利用产品检测化学成分信息与感官评估指标建立数字化模型。例如,在啤酒行业,企业会先检测出啤酒样品的化学成分,例如啤酒的碳水化合物、含氮物质、矿物质及微量元素等,然后与色、香、味、泡沫等感官指标建立某种关系,确定数学模型。但实际上,受企业检测条件和检测速度、成本等因素的限制,往往仅能给出几个常规的检测指标,而利用仅有的几个常规检测指标与感官指标之间建立起的数学模型,其准确性较低,因此,无法达到专家评估的效果。
发明内容
本发明的目的在于提供一种配方产品感官质量的数字化评估方法,以解决传统的专家品评方法受主观因素影响严重、现有的数字化评估方法准确性低的问题。
为解决上述技术问题,本发明采用以下技术方案予以实现:
一种配方产品感官质量的数字化评估方法,包括:
利用m个配方产品的测量数据作为训练样本,建立训练样本矩阵X;
根据专家品评结果,对训练样本矩阵X中的每一个训练样本的感官指标赋予评估值,建立专家感官品评向量Y;
在对测试样本xm+1进行感官指标评估时,将测试样本xm+1加入训练样本矩阵X,形成集合X(m+1);
根据专家感官品评向量Y中的感官指标的个数为测试样本xm+1分配相同个数的感官指标;
根据集合X(m+1)中样本之间的距离,采用相似性度量方法表达样本之间的分布差异;
根据测试样本与训练样本之间的分布差异,选择分布相似程度最高的训练样本的感官指标的评估值预测所述测试样本xm+1的感官指标评估值。
在本申请的一些实施例中,所述采用相似性度量方法表达样本之间的分布差异的过程可以包括:
利用所述训练样本矩阵X和专家感官品评向量Y构建一个训练样本序列Z(m):
Z(m)=(z1,z2,...,zm);zi={(xi,y1),(xi,y2),...(xi,yk),...,(xi,ys)};i=(1,2,...,m);
其中,xi表示第i个训练样本;(xi,yk)中的yk表示第i个训练样本xi的第k个感官指标;s为感官指标的总个数;
计算训练样本序列Z(m)中每一个样本Zi的相似性度量值;
构建测试样本xm+1的检验样本zm+1:
zm+1={(xm+1,y1),(xm+1,y2),...,(xm+1,ys)};
将检验样本zm+1加入训练样本序列Z(m),构成检验样本序列Z(m+1):
Z(m+1)=(z1,z2,...,zm,zm+1);
计算检验样本序列Z(m+1)中,检验样本Zm+1与训练样本之间的相似性度量值。
在本申请的一些实施例中,所述计算训练样本序列Z(m)中每一个样本Zi的相似性度量值的过程可以包括:
从训练样本序列Z(m)中,选取感官指标yk=u的训练样本形成同类别样本序列,选取感官指标yk≠u的训练样本形成不同类别样本序列;其中,u为感官指标yk的评估值;
结合同一感官指标yk的同类别样本序列和不同类别样本序列,计算每一个训练样本的相似性度量值,计算方法如下:
其中,表示训练样本xi在其第k个感官指标yk的评估值为u时与其它训练样本之间的相似性度量值;k=1,2,...,s;u=1,2,...,h;v为yk=u的训练样本的总个数,且v<m;公式中,分子表示与zi具有同类别且最短距离的c个训练样本到zi的距离之和;分母表示与zi具有不同类别且最短距离的c个训练样本到zi的距离之和;c为整数,自行设定。
在本申请的一些实施例中,所述计算检验样本序列Z(m+1)中,检验样本Zm+1与训练样本之间的相似性度量值的过程可以包括:
分别为测试样本xm+1的每一个感官指标赋予不同的评估值;
分别计算测试样本xm+1在每一个感官指标等于不同的评估值时,检验样本zm+1与训练样本之间的相似性度量值,计算方法如下:
其中,表示测试样本xm+1在其第k个感官指标yk的评估值为u时与训练样本之间的相似性度量值;公式中,分子表示与zm+1具有同类别且最短距离的c个训练样本到zm+1的距离之和;分母表示与zm+1具有不同类别且最短距离的c个训练样本到zm+1的距离之和。
在本申请的一些实施例中,所述测试样本xm+1的感官指标评估值的预测方法可以包括:
计算检验样本zm+1={(xm+1,y1),(xm+1,y2),...,(xm+1,ys)}中每一个组合的随机性检验Qk值:
其中,分子表示集合中元素满足要求的个数;
选择Qk值中的最大值所对应的评估值u,作为测试样本的第k个感官指标yk的评估值,其公式表达为:
CLK=MAX(Qk);
其中,CLK即为测试样本xm+1的第k个感官指标yk的评估值。
在本申请的一些实施例中,在形成所述集合X(m+1)时,首先对集合X(m+1)进行预处理,以减少干扰影响;然后,采用主成分分析法对预处理后的矩阵进行降维空间映射,以降低矩阵空间维度,生成降维后的主成分得分矩阵B(m+1):
其中,n为每一个样本的测量数据的个数;p为主成分个数,且p<n;Bi为得分向量;W为载荷矩阵,表示主成分与对应原变量之间的相互关联程度,利用以下公式计算获得:
其中,λi为第i个样本的特征根,aij为第i个样本的第j个特征向量。
利用降维后的主成分得分矩阵B(m+1),计算所述集合X(m+1)中样本之间的距离,可以解决采用一般方法难以有效预测其感观质量的问题。
在本申请的一些实施例中,优选采用马氏距离方法计算所述集合X(m+1)中样本之间的距离。
在本申请的一些实施例中,为了获得配方产品中丰富的结构和组成信息,优选利用近红外光谱分析仪、质谱仪或者色谱仪获取训练样本和测试样本的光谱数据、质谱数据或色谱数据,形成样本的测量数据。
在本申请的一些实施例中,对所述集合X(m+1)进行的预处理可以包括一阶导数、Norris平滑滤波以及PCA主成分预处理等。
在本申请的一些实施例中,所述建立专家感官品评向量Y的过程可以包括:
组织专家对m个训练样本分别进行品评,并针对每一个训练样本分别建立一个专家感官品评向量Y:
以等级或者档次的方式为每一个训练样本的每一个感观指标赋予评估值1、2、…、h。
与现有技术相比,本发明的优点和积极效果是:本发明利用配方产品的测试数据与其感官质量之间的内在关系,建立数字化评估模型;利用样本之间的距离,采用相似性度量方法表达样本之间的分布差异;根据测试样本与训练样本之间的分布差异,选择分布相似程度最高的训练样本的感官指标的评估值预测测试样本的感官指标评估值,方法简单有效,评估结果不受人为主观因素影响,可信度高。
结合附图阅读本发明实施方式的详细描述后,本发明的其他特点和优点将变得更加清楚。
附图说明
图1为本发明所提出的配方产品感官质量的数字化评估方法的一种实施例的总体流程图。
具体实施方式
下面结合附图对本发明的具体实施方式进行详细地描述。
具有感官评估特征的配方产品,其主体原料大多是农副产品,而非标准的工业制成品,因此,其内在属性信息难以实现清晰的数字化描述。同样地,对于配方产品而言,专家的品评感官难以量化表达,因此,也无法实现对所有感官特征的一一描述。
本实施例利用原料/产品属性信息与其感官质量之间的内在关系,采用科学求解方法建立映射关系,实现从输入空间到输出空间的映射:
以此来获得对产品感官质量的数字化评估。
由于近红外光谱中含有丰富的结构和组成信息,非常适合用于碳氢有机物质的组成性质表现,并且样品光谱中含有几千种样品,物质样品中80%~90%以上的有用信息能够在近红外光谱中有所表现。因此,本实施例摒弃传统的利用产品化学成分信息与感官指标之间建立数字化模型的方法,充分利用样品近红外光谱中丰富的特征信息,建立产品物理化学特征信息与感官指标之间的数字化表达关系,即,两者之间构建形成准确性更高的关系模型,并对模型预测结果进行可信度评价,为专家提供更全面的参考。
当然,对于企业的样品检测数据为质谱/色谱等高维检测数据的情况,同样也可以采用本实施例的建模方法及评估技术获得有效的感官评估结果。
当输入空间维度较高时,例如原料检测数据为质谱/色谱/近红外光谱等上千维的高维数据时,采用一般方法难以有效预测其感官质量,因此,本实施例针对高维检测数据,采用主成分分析法进行降维空间映射,以实现对配方产品感官质量的数字化评价。
下面结合图1,对本实施例的配方产品感官质量的数字化评估方法的具体设计过程进行详细阐述。
S101、构建训练样本矩阵X。
在本实施例中,可以从样本库中提取m个产品样本,作为训练样本,利用近红外光谱分析仪、质谱仪或者色谱仪获取m个训练样本的光谱数据、质谱数据或色谱数据,统称为测量数据。该测量数据通常为高维数据,数量可达上千个。
之后,对获取到的测量数据进行预处理,例如进行一阶导数、Norris平滑滤波以及PCA主成分预处理后,形成训练样本矩阵X:
其中,n为每一个训练样本的测量数据的个数,即,光谱点维度、质谱点维度或色谱点维度等,n的取值通常在2000~3000个左右。由此形成的训练样本矩阵X是一个m×n的高维空间矩阵。
S102、对训练样本矩阵X中的每一个训练样本的感官指标赋予评估值,建立专家感官品评向量Y。
组织专家对m个训练样本分别进行品评,并针对每一个训练样本分别建立一个专家感官品评向量Y:
其中,yk表示第k个感官指标,s为感官指标的总个数。
以烟叶为训练样本为例,烟叶的感官指标通常包括5个,即,s=5,分别为香气、谐调、杂气、刺激、余味。专家为每一个训练样本xi的5个感官指标分别赋予评估值,以形成专家感官品评向量Y。
在本实施例中,每一个感官指标的评估值可以设置为1、2、…、h,即,以等级或者档次的方式定义感官指标的评估值。
S103、利用训练样本矩阵X和专家感官品评向量Y构建一个训练样本序列Z(m):
Z(m)=(z1,z2,...,zm);zi={(xi,y1),(xi,y2),...(xi,yk),...,(xi,ys)};i=(1,2,...,m);
其中,xi表示第i个训练样本;(xi,yk)中的yk表示第i个训练样本xi的第k个感官指标。
S104、当有一个测试样本xm+1输入时,将测试样本xm+1加入训练样本矩阵X,形成集合X(m+1):
X(m+1)=(x1,x2,...,xm,xm+1)。
S105、构建测试样本xm+1的检验样本zm+1:
zm+1={(xm+1,y1),(xm+1,y2),...,(xm+1,ys)}。
本实施例为测试样本xm+1也分配s个感官指标,至于每一个感官指标的评估值,可以根据测试样本与训练样本之间的分布差异,选择分布相似程度最高的训练样本的感官指标的评估值预测测试样本的感官指标评估值。
S106、将检验样本zm+1加入训练样本序列Z(m),构成检验样本序列Z(m+1):
Z(m+1)=(z1,z2,...,zm,zm+1)。
S107、对集合X(m+1)进行预处理,并采用主成分分析法对预处理后的矩阵进行降维空间映射,生成降维后的主成分得分矩阵B(m+1):
其中,p为主成分个数,且p<n,通常p取小于100的值,在本实施例中可以配置p=10;Bi为得分向量;W为载荷矩阵,表示主成分与对应原变量之间的相互关联程度,可以利用以下公式计算获得:
其中,λi为第i个样本的特征根,aij为第i个样本的第j个特征向量。
S108、根据主成分得分矩阵B(m+1),计算样本之间的距离。
在本实施例中,可以采用马氏距离方法计算样本之间的距离,其计算公式为:
其中,dij表示第i个样本与第j个样本之间的距离,i,j=(1,2,...,m+1)。由此便可形成距离矩阵D:
S109、根据样本之间的距离,采用相似性度量方法表达检验样本序列Z(m+1)中样本之间的分布差异。
首先,计算训练样本序列Z(m)中每一个样本Zi的相似性度量值,其具体方法是:
从训练样本序列Z(m)中,选取感官指标yk=u的训练样本形成同类别样本序列,选取感官指标yk≠u的训练样本形成不同类别样本序列。
例如,可以首先从训练样本序列Z(m)中,选取第一个感官指标y1=1的训练样本构成一个同类别样本序列,选取第一个感官指标y1≠1的训练样本构成一个不同类别样本序列;选取第一个感官指标y1=2的训练样本构成一个同类别样本序列,选取第一个感官指标y1≠2的训练样本构成一个不同类别样本序列;以此类推,直到选取第一个感官指标y1=h的训练样本构成一个同类别样本序列,选取第一个感官指标y1≠h的训练样本构成一个不同类别样本序列。然后,选取第二个感官指标y2=1的训练样本构成一个同类别样本序列,选取第二个感官指标y2≠1的训练样本构成一个不同类别样本序列;……;选取第二个感官指标y2=h的训练样本构成一个同类别样本序列,选取第二个感官指标y2≠h的训练样本构成一个不同类别样本序列。以此类推,选取第s个感官指标ys=1的训练样本构成一个同类别样本序列,选取第s个感官指标ys≠1的训练样本构成一个不同类别样本序列;……;选取第s个感官指标ys=h的训练样本构成一个同类别样本序列,选取第s个感官指标ys≠h的训练样本构成一个不同类别样本序列。
结合同一感官指标yk的同类别样本序列和不同类别样本序列,计算每一个训练样本的相似性度量值计算方法如下:
其中,表示训练样本xi在其第k个感官指标的评估值为u时与其它训练样本之间的相似性度量值;k=1,2,...,s;u=1,2,...,h;v为yk=u的训练样本的总个数,且v<m,即,第k个感官指标的评估值为u的训练样本总个数;c为整数,可以自行设定;在上述相似性度量值/>公式中,分子表示与zi具有同类别且最短距离的c个训练样本到zi的距离之和(这些训练样本可以从yk=u的同类别样本序列中选取),反映了相同类别的训练样本数据之间的相近似程度;分母表示与zi具有不同类别且最短距离的c个训练样本到zi的距离之和(这些训练样本可以从yk≠u的不同类别样本序列中选取),反映了不同类别的训练样本之间的疏散程度。
其次,计算检验样本序列Z(m+1)中检验样本Zm+1的相似性度量值,其具体方法是:
(1)分别为测试样本xm+1的每一个感官指标赋予不同的评估值;
例如,针对测试样本xm+1,对其第一个感官指标y1分别赋予评估值1、2、h;对其第二个感官指标y2分别赋予评估值1、2、h;以此类推,对其第s个感官指标ys分别赋予评估值1、2、h。
(2)分别计算测试样本xm+1在每一个感官指标等于不同的评估值时,检验样本zm+1与训练样本之间的相似性度量值,计算方法如下:
其中,表示测试样本xm+1在其第k个感官指标的评估值为u时与训练样本之间的相似性度量值。在上述相似性度量值/>公式中,分子表示与zm+1具有同类别且最短距离的c个训练样本到zm+1的距离之和,反映了相同类别的训练样本与测试样本之间的相近似程度;分母表示与zm+1具有不同类别且最短距离的c个训练样本到zm+1的距离之和,反映了不同类别的训练样本与测试样本之间的疏散程度。
S110、计算检验样本zm+1={(xm+1,y1),(xm+1,y2),...,(xm+1,ys)}中每一个组合的随机性检验Qk值。
随机性检验所需的Qk值函数可以定义为:
其中,分子表示集合中元素满足要求的个数。即,上述公式表示感官指标yk=u时,训练样本之间的相似性度量值大于等于测试样本与训练样本之间的相似性度量值的个数与v+1的比值。
这样,对于测试样本xm+1而言,其每一个感官指标均对应h个比值;即,Q1中包括h个比值;Q2中包括h个比值;……;Qs中也包括h个比值。
Qk值的大小反映了由检验样本zm+1构成的检验样本序列Z(m+1)符合独立同分布的可能性,也反映了该检验样本zm+1属于yk=u的可能性大小。Qk值越小,说明测试样本与训练样本之间的分布差异较大;Qk值越大,说明测试样本与训练样本之间的分布相似程度越高。从另外一个角度,可以判断出测试样本属于yk=u的可能性概率。
S111、根据Qk值,采用可信度评价方法确定测试样本的每一个感官指标的评估值。
在本实施例中,可以选择Qk值中最大比值所对应的评估值u,作为测试样本的第k个感官指标yk的评估值,其公式可以表达为:
CLK=MAX(Qk),k=1,2,...,s;
其中,CLK即为测试样本xm+1的第k个感官指标yk的评估值。
即,选择分布相似程度最高的训练样本的感官指标评估值预测测试样本的感官指标的评估值。
本实施例采用基于产品分析光谱/质谱/色谱信息的数字化感官评估,比传统的专家经验品评或者基于检测几个关键化学成分的数字化感官评价的准确性更高,更稳定,而且成本更低。
当然,以上所述仅是本发明的一种优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种配方产品感官质量的数字化评估方法,其特征在于,包括:
利用m个配方产品的测量数据作为训练样本,建立训练样本矩阵X;
根据专家品评结果,对训练样本矩阵X中的每一个训练样本的感官指标赋予评估值,建立专家感官品评向量Y;
在对测试样本xm+1进行感官指标评估时,将测试样本xm+1加入训练样本矩阵X,形成集合X(m+1);
根据专家感官品评向量Y中的感官指标的个数为测试样本xm+1分配相同个数的感官指标;
根据集合X(m+1)中样本之间的距离,采用相似性度量方法表达样本之间的分布差异;
根据测试样本与训练样本之间的分布差异,选择分布相似程度最高的训练样本的感官指标的评估值预测所述测试样本xm+1的感官指标评估值。
2.根据权利要求1所述的配方产品感官质量的数字化评估方法,其特征在于,所述采用相似性度量方法表达样本之间的分布差异的过程包括:
利用所述训练样本矩阵X和专家感官品评向量Y构建一个训练样本序列Z(m):
Z(m)=(z1,z2,…,zm);zi={(xi,y1),(xi,y2),…(xi,yk),…,(xi,ys)};i=(1,2,…,m);
其中,xi表示第i个训练样本;(xi,yk)中的yk表示第i个训练样本xi的第k个感官指标;s为感官指标的总个数;
计算训练样本序列Z(m)中每一个样本Zi的相似性度量值;
构建测试样本xm+1的检验样本zm+1:
zm+1={(xm+1,y1),(xm+1,y2),…,(xm+1,ys)};
将检验样本zm+1加入训练样本序列Z(m),构成检验样本序列Z(m+1):
Z(m+1)=(z1,z2,…,zm,zm+1);
计算检验样本序列Z(m+1)中,检验样本Zm+1与训练样本之间的相似性度量值。
3.根据权利要求2所述的配方产品感官质量的数字化评估方法,其特征在于,所述计算训练样本序列Z(m)中每一个样本Zi的相似性度量值的过程包括:
从训练样本序列Z(m)中,选取感官指标yk=y的训练样本形成同类别样本序列,选取感官指标yk≠u的训练样本形成不同类别样本序列;其中,u为感官指标yk的评估值;
结合同一感官指标yk的同类别样本序列和不同类别样本序列,计算每一个训练样本的相似性度量值,计算方法如下:
其中,表示训练样本xi在其第k个感官指标yk的评估值为u时与其它训练样本之间的相似性度量值;k=1,2,…,s;u=1,2,…,h;v为yk=u的训练样本的总个数,且v<m;公式中,分子表示与zi具有同类别且最短距离的c个训练样本到zi的距离之和;分母表示与zi具有不同类别且最短距离的c个训练样本到zi的距离之和;c为整数,自行设定。
4.根据权利要求3所述的配方产品感官质量的数字化评估方法,其特征在于,所述计算检验样本序列Z(m+1)中,检验样本Zm+1与训练样本之间的相似性度量值的过程包括:
分别为测试样本xm+1的每一个感官指标赋予不同的评估值;
分别计算测试样本xm+1在每一个感官指标等于不同的评估值时,检验样本zm+1与训练样本之间的相似性度量值,计算方法如下:
其中,表示测试样本xm+1在其第k个感官指标yk的评估值为u时与训练样本之间的相似性度量值;公式中,分子表示与zm+1具有同类别且最短距离的c个训练样本到zm+1的距离之和;分母表示与zm+1具有不同类别且最短距离的c个训练样本到zm+1的距离之和。
5.根据权利要求4所述的配方产品感官质量的数字化评估方法,其特征在于,所述测试样本xm+1的感官指标评估值的预测方法包括:
计算检验样本zm+1={(xm+1,y1),(xm+1,y2),…,(xm+1,ys)}中每一个组合的随机性检验Qk值:
其中,分子表示集合中元素满足要求的个数;
选择Qk值中的最大值所对应的评估值u,作为测试样本的第k个感官指标yk的评估值,其公式表达为:
CLK=MAX(Qk);
其中,CLK即为测试样本xm+1的第k个感官指标yk的评估值。
6.根据权利要求1至5中任一项所述的配方产品感官质量的数字化评估方法,其特征在于,在形成所述集合X(m+1)时,对集合X(m+1)进行预处理,并采用主成分分析法对预处理后的矩阵进行降维空间映射,生成降维后的主成分得分矩阵B(m+1):
其中,n为每一个样本的测量数据的个数;p为主成分个数,且p<n;Bi为得分向量;W为载荷矩阵,表示主成分与对应原变量之间的相互关联程度,利用以下公式计算获得:
其中,λi为第i个样本的特征根,aij为第i个样本的第j个特征向量。
根据主成分得分矩阵B(m+1),计算所述集合X(m+1)中样本之间的距离。
7.根据权利要求6的配方产品感官质量的数字化评估方法,其特征在于,采用马氏距离方法计算所述集合X(m+1)中样本之间的距离。
8.根据权利要求6的配方产品感官质量的数字化评估方法,其特征在于,每一个样本的测量数据是利用近红外光谱分析仪、质谱仪或者色谱仪获取到的样本光谱数据、质谱数据或色谱数据。
9.根据权利要求6的配方产品感官质量的数字化评估方法,其特征在于,对所述集合X(m +1)进行的预处理包括一阶导数、Norris平滑滤波以及PCA主成分预处理。
10.根据权利要求1至5中任一项所述的配方产品感官质量的数字化评估方法,其特征在于,所述建立专家感官品评向量Y的过程包括:
组织专家对m个训练样本分别进行品评,并针对每一个训练样本分别建立一个专家感官品评向量Y:
以等级或者档次的方式为每一个训练样本的每一个感观指标赋予评估值1、2、…、h。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310586222.5A CN116721714A (zh) | 2023-05-22 | 2023-05-22 | 一种配方产品感官质量的数字化评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310586222.5A CN116721714A (zh) | 2023-05-22 | 2023-05-22 | 一种配方产品感官质量的数字化评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116721714A true CN116721714A (zh) | 2023-09-08 |
Family
ID=87868842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310586222.5A Pending CN116721714A (zh) | 2023-05-22 | 2023-05-22 | 一种配方产品感官质量的数字化评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116721714A (zh) |
-
2023
- 2023-05-22 CN CN202310586222.5A patent/CN116721714A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016000088A1 (zh) | 一种基于最佳指数-相关系数法的高光谱波段提取方法 | |
CN108256761A (zh) | 顶置武器站灰色模糊综合评价方法 | |
CN109324013B (zh) | 利用高斯过程回归模型构建原油性质近红外快速分析方法 | |
CN101520412A (zh) | 基于独立分量分析和遗传神经网络的近红外光谱分析方法 | |
Xu et al. | Applying convolutional neural networks (CNN) for end-to-end soil analysis based on laser-induced breakdown spectroscopy (LIBS) with less spectral preprocessing | |
CN108181263B (zh) | 基于近红外光谱的烟叶部位特征提取及判别方法 | |
CN102222164A (zh) | 一种食品感官质量评价方法及系统 | |
CN105424641B (zh) | 一种原油种类的近红外光谱识别方法 | |
CN109253985B (zh) | 基于神经网络的近红外光谱识别古筝面板用木材等级的方法 | |
CN109376805A (zh) | 一种基于白酒基酒指纹图谱特征的分类方法 | |
CN101419209A (zh) | 卷烟感官评吸和烟气指标的免疫神经网络预测方法 | |
CN104713835A (zh) | 一种烟叶颜色在线数值化识别方法 | |
CN106022650A (zh) | 一种卷烟综合质量的分析方法 | |
CN114239397A (zh) | 基于动态特征提取与局部加权深度学习的软测量建模方法 | |
CN101201331B (zh) | 一种在线确定初馏塔顶石脑油质量指标的软测量方法 | |
CN110309609A (zh) | 一种基于粗糙集和小波神经网络的建筑室内空气品质评价方法 | |
CN111896495A (zh) | 基于深度学习与近红外光谱太平猴魁产地甄别方法及系统 | |
CN101539517A (zh) | 应用模糊逻辑模型对高光泽度涂层表面进行评价的方法 | |
CN110132879A (zh) | 一种基于近红外光谱的烤烟香韵鉴别方法 | |
CN115096357A (zh) | 一种基于ceemdan-pca-lstm的室内环境质量预测方法 | |
CN110990782A (zh) | 基于加权犹豫模糊幂集结算子的卷烟感官质量评价方法 | |
Shao et al. | A new approach to discriminate varieties of tobacco using vis/near infrared spectra | |
CN108663334A (zh) | 基于多分类器融合寻找土壤养分光谱特征波长的方法 | |
CN108985336A (zh) | 一种基于多层支持向量机的水果品质分类方法 | |
CN116721714A (zh) | 一种配方产品感官质量的数字化评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |