CN109115908B - 基于层次聚类提取特征的切达奶酪身份的判别标识方法 - Google Patents
基于层次聚类提取特征的切达奶酪身份的判别标识方法 Download PDFInfo
- Publication number
- CN109115908B CN109115908B CN201811002830.2A CN201811002830A CN109115908B CN 109115908 B CN109115908 B CN 109115908B CN 201811002830 A CN201811002830 A CN 201811002830A CN 109115908 B CN109115908 B CN 109115908B
- Authority
- CN
- China
- Prior art keywords
- cheese
- cluster
- cheddar cheese
- identity
- characteristic flavor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 235000013351 cheese Nutrition 0.000 title claims abstract description 96
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000000605 extraction Methods 0.000 title claims abstract description 16
- 239000000796 flavoring agent Substances 0.000 claims abstract description 90
- 235000019634 flavors Nutrition 0.000 claims abstract description 85
- 238000012706 support-vector machine Methods 0.000 claims abstract description 14
- 238000010790 dilution Methods 0.000 claims description 22
- 239000012895 dilution Substances 0.000 claims description 22
- 230000014759 maintenance of location Effects 0.000 claims description 18
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 claims description 18
- 150000001875 compounds Chemical class 0.000 claims description 15
- KSMVZQYAVGTKIV-UHFFFAOYSA-N decanal Chemical compound CCCCCCCCCC=O KSMVZQYAVGTKIV-UHFFFAOYSA-N 0.000 claims description 12
- SHZIWNPUGXLXDT-UHFFFAOYSA-N ethyl hexanoate Chemical compound CCCCCC(=O)OCC SHZIWNPUGXLXDT-UHFFFAOYSA-N 0.000 claims description 12
- MMXKVMNBHPAILY-UHFFFAOYSA-N ethyl laurate Chemical compound CCCCCCCCCCCC(=O)OCC MMXKVMNBHPAILY-UHFFFAOYSA-N 0.000 claims description 12
- CATSNJVOTSVZJV-UHFFFAOYSA-N heptan-2-one Chemical compound CCCCCC(C)=O CATSNJVOTSVZJV-UHFFFAOYSA-N 0.000 claims description 12
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 claims description 12
- KQNPFQTWMSNSAP-UHFFFAOYSA-N isobutyric acid Chemical compound CC(C)C(O)=O KQNPFQTWMSNSAP-UHFFFAOYSA-N 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 12
- 239000000126 substance Substances 0.000 claims description 12
- 230000001953 sensory effect Effects 0.000 claims description 11
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 claims description 9
- 125000004432 carbon atom Chemical group C* 0.000 claims description 9
- 239000000243 solution Substances 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 239000007789 gas Substances 0.000 claims description 7
- 239000002904 solvent Substances 0.000 claims description 7
- GHBSPIPJMLAMEP-UHFFFAOYSA-N 6-pentyloxan-2-one Chemical compound CCCCCC1CCCC(=O)O1 GHBSPIPJMLAMEP-UHFFFAOYSA-N 0.000 claims description 6
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Chemical compound CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 claims description 6
- QSJXEFYPDANLFS-UHFFFAOYSA-N Diacetyl Chemical compound CC(=O)C(C)=O QSJXEFYPDANLFS-UHFFFAOYSA-N 0.000 claims description 6
- HUMNYLRZRPPJDN-UHFFFAOYSA-N benzaldehyde Chemical compound O=CC1=CC=CC=C1 HUMNYLRZRPPJDN-UHFFFAOYSA-N 0.000 claims description 6
- HFJRKMMYBMWEAD-UHFFFAOYSA-N dodecanal Chemical compound CCCCCCCCCCCC=O HFJRKMMYBMWEAD-UHFFFAOYSA-N 0.000 claims description 6
- RGXWDWUGBIJHDO-UHFFFAOYSA-N ethyl decanoate Chemical compound CCCCCCCCCC(=O)OCC RGXWDWUGBIJHDO-UHFFFAOYSA-N 0.000 claims description 6
- MNWFXJYAOYHMED-UHFFFAOYSA-N heptanoic acid Chemical compound CCCCCCC(O)=O MNWFXJYAOYHMED-UHFFFAOYSA-N 0.000 claims description 6
- GWYFCOCPABKNJV-UHFFFAOYSA-N isovaleric acid Chemical compound CC(C)CC(O)=O GWYFCOCPABKNJV-UHFFFAOYSA-N 0.000 claims description 6
- XMGQYMWWDOXHJM-UHFFFAOYSA-N limonene Chemical compound CC(=C)C1CCC(C)=CC1 XMGQYMWWDOXHJM-UHFFFAOYSA-N 0.000 claims description 6
- VKCYHJWLYTUGCC-UHFFFAOYSA-N nonan-2-one Chemical compound CCCCCCCC(C)=O VKCYHJWLYTUGCC-UHFFFAOYSA-N 0.000 claims description 6
- FBUKVWPVBMHYJY-UHFFFAOYSA-N nonanoic acid Chemical compound CCCCCCCCC(O)=O FBUKVWPVBMHYJY-UHFFFAOYSA-N 0.000 claims description 6
- KYWIYKKSMDLRDC-UHFFFAOYSA-N undecan-2-one Chemical compound CCCCCCCCCC(C)=O KYWIYKKSMDLRDC-UHFFFAOYSA-N 0.000 claims description 6
- NQPDZGIKBAWPEJ-UHFFFAOYSA-N valeric acid Chemical compound CCCCC(O)=O NQPDZGIKBAWPEJ-UHFFFAOYSA-N 0.000 claims description 6
- QRPLZGZHJABGRS-UHFFFAOYSA-N xi-5-Dodecanolide Chemical compound CCCCCCCC1CCCC(=O)O1 QRPLZGZHJABGRS-UHFFFAOYSA-N 0.000 claims description 6
- 150000007514 bases Chemical class 0.000 claims description 5
- WGPCZPLRVAWXPW-NSHDSACASA-N 5-octyloxolan-2-one Chemical compound CCCCCCCC[C@H]1CCC(=O)O1 WGPCZPLRVAWXPW-NSHDSACASA-N 0.000 claims description 4
- PXRBWNLUQYZAAX-UHFFFAOYSA-N 6-Butyltetrahydro-2H-pyran-2-one Chemical compound CCCCC1CCCC(=O)O1 PXRBWNLUQYZAAX-UHFFFAOYSA-N 0.000 claims description 4
- 239000012159 carrier gas Substances 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 4
- 238000001704 evaporation Methods 0.000 claims description 4
- WGPCZPLRVAWXPW-LLVKDONJSA-N gamma-Dodecalactone Natural products CCCCCCCC[C@@H]1CCC(=O)O1 WGPCZPLRVAWXPW-LLVKDONJSA-N 0.000 claims description 4
- 239000001307 helium Substances 0.000 claims description 4
- 229910052734 helium Inorganic materials 0.000 claims description 4
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 claims description 4
- WJTCHBVEUFDSIK-NWDGAFQWSA-N (2r,5s)-1-benzyl-2,5-dimethylpiperazine Chemical compound C[C@@H]1CN[C@@H](C)CN1CC1=CC=CC=C1 WJTCHBVEUFDSIK-NWDGAFQWSA-N 0.000 claims description 3
- HNAGHMKIPMKKBB-UHFFFAOYSA-N 1-benzylpyrrolidine-3-carboxamide Chemical compound C1C(C(=O)N)CCN1CC1=CC=CC=C1 HNAGHMKIPMKKBB-UHFFFAOYSA-N 0.000 claims description 3
- RZTOWFMDBDPERY-UHFFFAOYSA-N Delta-Hexanolactone Chemical compound CC1CCCC(=O)O1 RZTOWFMDBDPERY-UHFFFAOYSA-N 0.000 claims description 3
- 239000005643 Pelargonic acid Substances 0.000 claims description 3
- 150000001335 aliphatic alkanes Chemical class 0.000 claims description 3
- RHDGNLCLDBVESU-UHFFFAOYSA-N but-3-en-4-olide Chemical compound O=C1CC=CO1 RHDGNLCLDBVESU-UHFFFAOYSA-N 0.000 claims description 3
- OBNCKNCVKJNDBV-UHFFFAOYSA-N butanoic acid ethyl ester Natural products CCCC(=O)OCC OBNCKNCVKJNDBV-UHFFFAOYSA-N 0.000 claims description 3
- 229910052799 carbon Inorganic materials 0.000 claims description 3
- 238000007865 diluting Methods 0.000 claims description 3
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 claims description 3
- 238000002347 injection Methods 0.000 claims description 3
- 239000007924 injection Substances 0.000 claims description 3
- 150000002576 ketones Chemical class 0.000 claims description 3
- 229940087305 limonene Drugs 0.000 claims description 3
- 235000001510 limonene Nutrition 0.000 claims description 3
- 238000001819 mass spectrum Methods 0.000 claims description 3
- YYZUSRORWSJGET-UHFFFAOYSA-N octanoic acid ethyl ester Natural products CCCCCCCC(=O)OCC YYZUSRORWSJGET-UHFFFAOYSA-N 0.000 claims description 3
- QNGNSVIICDLXHT-UHFFFAOYSA-N para-ethylbenzaldehyde Natural products CCC1=CC=C(C=O)C=C1 QNGNSVIICDLXHT-UHFFFAOYSA-N 0.000 claims description 3
- 235000013555 soy sauce Nutrition 0.000 claims description 3
- 229940005605 valeric acid Drugs 0.000 claims description 3
- 150000007513 acids Chemical class 0.000 claims 3
- 230000007935 neutral effect Effects 0.000 claims 3
- 238000010521 absorption reaction Methods 0.000 claims 1
- 239000006185 dispersion Substances 0.000 claims 1
- 230000008020 evaporation Effects 0.000 claims 1
- 238000011156 evaluation Methods 0.000 description 6
- 125000004429 atom Chemical group 0.000 description 4
- 230000035943 smell Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 240000002129 Malva sylvestris Species 0.000 description 2
- 235000006770 Malva sylvestris Nutrition 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 238000007621 cluster analysis Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- -1 delta-nonanolide Chemical compound 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000003205 fragrance Substances 0.000 description 2
- 238000004817 gas chromatography Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- WGPCZPLRVAWXPW-UHFFFAOYSA-N xi-Dihydro-5-octyl-2(3H)-furanone Chemical compound CCCCCCCCC1CCC(=O)O1 WGPCZPLRVAWXPW-UHFFFAOYSA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000010198 maturation time Effects 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002470 solid-phase micro-extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000019590 thick flavour Nutrition 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/50—Conditioning of the sorbent material or stationary liquid
- G01N30/52—Physical parameters
- G01N30/54—Temperature
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N2030/022—Column chromatography characterised by the kind of separation mechanism
- G01N2030/025—Gas chromatography
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Dairy Products (AREA)
Abstract
本发明公布了一种基于层次聚类提取特征的切达奶酪身份判别标识方法,包括:对切达奶酪的特征风味组分进行确定并定量,检测得到样品中的特征风味组分含量;对多种特征风味组分进行层次聚类,生成身份标识性特征风味组分模型;利用支持向量机SVM模型判别未知切达奶酪的级别。采用本发明技术方案进行切达奶酪身份判别标识,能够节省大量人力费用,提高切达奶酪身份判别的准确率,使奶酪分级更加客观、有效。
Description
技术领域
本发明涉及奶酪身份特征的识别技术,尤其涉及一种基于层次聚类提取特征的切达奶酪身份判别标识的方法。
背景技术
切达奶酪具有浓郁的奶香味和清新的坚果味,是目前我国进口最多的奶酪品种之一,国外按切达奶酪成熟时的风味、结构质地、颜色和外观将切达奶酪分为淡味(mild)、中味(medium)、浓味(mature)三个级别,随着成熟的时间越长,其品质越好,因而价格也越高。通常而言不同级别奶酪的评价大多以主观的感官评价为主,缺少客观的评价标准,因而不同生产厂家,不同产区的切达奶酪品质相差较大。另外对于奶酪基本依赖进口的我国而言,切达奶酪的感官评定分级方法因缺少生产经验而难以操作,主要依赖进口标签对其进行分级,因此品质良莠不齐。如何利用仪器分析对进口切达奶酪的身份以及奶酪品质进行确定,一直是我国进口奶酪产业一个难以解决的问题。
奶酪的风味与其品质有较大相关性,是影响其质量的关键因素,不同等级的奶酪具有不同浓度的挥发性特征组分,因此近年来也有研究者利用风味分析方法对切达奶酪分级展开初步研究,但大多采用固相微萃取气相色谱质谱联用仪(SPME-GC-MS)得到不同奶酪中的挥发性组分峰面积,再结合电子鼻,采用主成分分析(Principal ComponentAnalysis)、聚类分析(Cluster Analysis)、偏最小二乘法(Partial Least Squares)等方法直接鉴别样本,并没有对不同等级奶酪特有的身份判别风味组分进行分析,信息特征不够,因而不能准确地区分不同成熟期的切达奶酪。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于层次聚类提取特征的切达奶酪身份判别标识的方法,基于层次聚类方法提取切达奶酪特征,建立切达奶酪身份标识性特征风味组分模型,识别出不同的身份标识性特征风味组分,由此判别切达奶酪的身份等级。
本发明提供的技术方案是:
一种基于层次聚类提取特征的切达奶酪身份判别标识方法,包括如下步骤:
1)对切达奶酪的特征风味组分进行确定并定量;执行如下操作:
11)采用香气提取物稀释分析方法(AEDA)测定多个不同级别切达奶酪的特征风味组分(为挥发性香气物质),得到每种特征风味组分香气稀释因子;
具体地,通过溶剂辅助风味蒸发法(SAFE),对切达奶酪样品的挥发性风味组分进行萃取,得到浓缩液;将得到的浓缩液用正己烷按1:3进行系列稀释,稀释倍数分别为3、9、81、243...,每次稀释后的溶液进入气相-嗅闻装置(GC-O)进行分析,直到感官评价员在嗅探口末端不再闻到任何气味则停止稀释,每种挥发性香气物质的最高稀释倍数即为其FD因子(Flavor dilution factor,香气稀释因子)。每个稀释倍数的样品由感官评价员分析三次,有两次以上在同一嗅闻时间有相同感官描述即为有效结果。通过AEDA方法确定得到切达奶酪中共有28种特征风味组分。
12)特征风味组分的标准曲线的制备;
将AEDA法选出的28种特征风味组分(香气标准品),按照其浓度范围选取14点浓度点计算标准曲线(最小回归偏差大于0.92)。即将酸性化合物(包括:乙酸、2-甲基-丙酸、丁酸、3-甲基-丁酸、戊酸、己酸、庚酸、壬酸)溶于10ml正己烷,将中/碱性化合物(2,3-丁二酮、丁酸乙酯、2-庚酮、柠檬烯、己酸乙酯、2-壬酮、辛酸乙酯、癸醛、苯甲醛、2-十一烷酮、癸酸乙酯、月桂醛、δ-己内酯、月桂酸乙酯、δ-壬内酯、呋喃酮、酱油酮、δ-癸内酯、γ-十二内酯、δ-十二内酯),按其在奶酪中的大致浓度范围配置并溶于10ml正己烷中,在此基础上做出28种特征风味组分标准曲线。
13)样品中特征风味组分含量检测;
气质条件为取1μL待测切达奶酪样品的SAFE提取物,用于气相色谱质谱联用分析。气相色谱条件:采用DB-WAX毛细管柱(30m×0.25mm,0.25μm),氦气作载气,使用1mL/min恒定流速。色谱柱升温程序:起始柱温35℃,保持5min,溶剂延迟4min,以5℃/min升到100℃,保持2min,然后以6℃/min升到180℃,最后以8℃/min升到230℃,保持2min。采用不分流模式,进样口温度为250℃。质谱条件:电子电离源,电离能量70eV,离子源温度为230℃,接口温度为250℃,四极杆温度150℃,检测器温度为280℃,扫描模式全扫描,质量范围m/z 20~350。
数据处理由MassHunter化学工作站完成,待鉴定的特征风味化合物经检索与NIST14谱库中该挥发性成分在DB-WAX毛细管柱分析的文献报道中保留指数进行对比,并根据每种化合物的标准曲线对化合物进行精确定量。
保留指数RI测定方法:在色谱条件相同的情况下,将正构烷烃C7~C40与切达奶酪在相同的色谱条件下得出GC保留时间,并根据公式(1)计算待测物i的保留指数(tn<ti<tn+1)。
其中,RI—保留指数;n—碳原子数;ti—为样品i的保留时间;tn—碳原子数为n的正构烷烃的保留时间;tn+1—碳原子数为n+1的正构烷烃的保留时间。
2)生成身份标识性特征风味组分模型;
对28种特征风味组分进行层次聚类,生成身份标识性特征风味组分模型,主要方法是通过计算风味组分(28种)两两之间的斯皮尔曼(spearman)相关系数形成28×28规模的距离矩阵,距离矩阵中每一列作为一个原子簇,然后合并这些原子簇为越来越大的簇,直到所有原子簇都在一个簇中,或者某个终结条件被满足,步骤如下:
21)风味组分浓度数据:
具体实施时,根据1)中方法检测,从21个切达奶酪样本得到的28种特征风味组分定量结果(切达奶酪样本化合物浓度),样本级别分布为:淡味、中味、浓味。
22)计算特征风味组分(28种)两两之间的斯皮尔曼(spearman)相关系数,形成距离矩阵;
23)采用离差平方和法(Ward variance minimization algorithm)进行层次聚类,计算公式如式(2):
其中,d(u,v)为簇u和v合并之后的离差平方和增量,簇u是由簇s和t组成的新簇,簇v是还未合并的簇,|*|为对应簇中原子簇的个数,T=|v|+|s|+|t|为簇u和v合并后原子簇的个数,通过合并簇u和v,使得新簇内离差平方和增量d(u,v)最小,即最初切达奶酪特征风味组合的距离矩阵中28个原子簇各成一簇,每次簇合并使得新簇的离差平方和增加,选择离差平方和增量最小的两簇进行合并,直到所有原子簇都在一个簇中。
切达奶酪特征风味组分层次聚类结果如图2,根据聚类结果选择不同簇个数,计算距离簇中心最近的风味化合物作为用于分类的身份标识性特征风味组分,不同的身份标识性特征风味组分如表1。
3)未知切达奶酪级别的判定;
利用支持向量机(Support Vector Machine,SVM)模型判别未知切达奶酪级别,根据不同的切达奶酪身份标识性特征风味组分,将21个待测样本输入支持向量机模型进行分类,通过五折交叉验证得到准确率和f1-score,f1-score是精确率(precision)和召回率(recall)的一种调和平均数,越高说明分类模型性能越好,如图3,当簇个数为8时,切达奶酪身份标识性特征风味组分为己酸乙酯、癸醛、2-甲基-丙酸、γ-十二内酯、己酸、2-庚酮、月桂酸乙酯、δ-壬内酯,分类器效果最好,准确率、f1-score均高达95%,能够很好的区分负样本和识别正样本,判定未知的切达奶酪级别。
与现有技术相比,本发明的有益效果是:
本发明提供一种基于层次聚类提取特征的切达奶酪身份判别标识的方法,能够很好的区分不同等级的切达奶酪。本发明具有以下技术优势:
(一)通过提取特征风味组分,创造了一种切达奶酪身份判别的新方法,与传统的感官评定方法相比,节省了大量人力与感官评价相关费用,同时对于不熟悉切达奶酪品质相关背景的我国消费者而言,具有使奶酪分级更加客观、有效的作用。
(二)本发明中,打破传统的奶酪判别方法,基于特征风味组分,采用机器学习的分类方法,提高了切达奶酪身份判别的准确率。
附图说明
图1为本发明提供方法中提取特征风味组分的流程框图。
图2为本发明实施例中切达奶酪特征风味组分层次聚类图。
图3为本发明实施例中不同切达奶酪特征风味组分的分类准确率及f1-score示意图。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供一种基于层次聚类提取特征的切达奶酪身份判别标识方法,能够很好的区分负样本和识别正样本,判定未知的切达奶酪级别。
图1为本发明提供的基于层次聚类提取特征的切达奶酪身份判别标识方法中提取特征风味组分的流程框图,具体实施包括如下步骤:
1)对切达奶酪的特征风味组分进行确定并定量;执行如下操作:
11)采用香气提取物稀释分析方法(AEDA)测定多个不同级别切达奶酪的特征风味组分(为挥发性香气物质),得到每种特征风味组分香气稀释因子;
具体地,通过溶剂辅助风味蒸发法(SAFE),对切达奶酪样品的挥发性风味组分进行萃取,得到浓缩液;将得到的浓缩液用正己烷按1:3进行系列稀释,稀释倍数分别为3、9、81、243...,每次稀释后的溶液进入气相-嗅闻装置(GC-O)进行分析,直到感官评价员在嗅探口末端不再闻到任何气味则停止稀释,每种挥发性香气物质的最高稀释倍数即为其FD因子(Flavor dilution factor,香气稀释因子)。每个稀释倍数的样品由感官评价员分析三次,有两次以上在同一嗅闻时间有相同感官描述即为有效结果。通过AEDA方法确定得到切达奶酪中共有28种特征风味组分。
12)特征风味组分的标准曲线的制备;
将AEDA法选出的28种特征风味组分,按照其浓度范围选取14点浓度点计算标准曲线(最小回归偏差大于0.92)。即将酸性化合物(包括:乙酸、2-甲基-丙酸、丁酸、3-甲基-丁酸、戊酸、己酸、庚酸、壬酸)溶于10ml正己烷,将中/碱性化合物(2,3-丁二酮、丁酸乙酯、2-庚酮、柠檬烯、己酸乙酯、2-壬酮、辛酸乙酯、癸醛、苯甲醛、2-十一烷酮、癸酸乙酯、月桂醛、δ-己内酯、月桂酸乙酯、δ-壬内酯、呋喃酮、酱油酮、δ-癸内酯、γ-十二内酯、δ-十二内酯),按其在奶酪中的大致浓度范围配置并溶于10ml正己烷中,在此基础上做出28种特征风味组分标准曲线。
13)样品中特征风味组分含量检测;
气质条件为取1μL待测切达奶酪样品的SAFE提取物,用于气相色谱质谱联用分析。气相色谱条件:采用DB-WAX毛细管柱(30m×0.25mm,0.25μm),氦气作载气,使用1mL/min恒定流速。色谱柱升温程序:起始柱温35℃,保持5min,溶剂延迟4min,以5℃/min升到100℃,保持2min,然后以6℃/min升到180℃,最后以8℃/min升到230℃,保持2min。采用不分流模式,进样口温度为250℃。质谱条件:电子电离源,电离能量70eV,离子源温度为230℃,接口温度为250℃,四极杆温度150℃,检测器温度为280℃,扫描模式全扫描,质量范围m/z 20~350。
数据处理由MassHunter化学工作站完成,待鉴定的特征风味化合物经检索与NIST14谱库中该挥发性成分在DB-WAX毛细管柱分析的文献报道中保留指数进行对比,并根据每种化合物的标准曲线对化合物进行精确定量。
保留指数RI测定方法:在色谱条件相同的情况下,将正构烷烃C7~C40与切达奶酪在相同的色谱条件下得出GC保留时间,并根据公式(1)计算待测物i的保留指数(tn<ti<tn+1)。
其中,RI—保留指数;n—碳原子数;ti—为样品i的保留时间;tn—碳原子数为n的正构烷烃的保留时间;tn+1—碳原子数为n+1的正构烷烃的保留时间。
2)生成身份标识性特征风味组分模型;
对28种特征风味组分进行层次聚类,生成身份标识性特征风味组分模型,主要方法是通过计算风味组分(28种)两两之间的斯皮尔曼(spearman)相关系数形成28×28规模的距离矩阵,距离矩阵中每一列作为一个原子簇,然后合并这些原子簇为越来越大的簇,直到所有原子簇都在一个簇中,或者某个终结条件被满足,步骤如下:
21)风味组分浓度数据:
具体实施时,根据1)中方法检测,从21个切达奶酪样本得到的28种特征风味组分定量结果(切达奶酪样本化合物浓度),样本级别分布为:淡味、中味、浓味。
22)计算特征风味组分(28种)两两之间的斯皮尔曼(spearman)相关系数,形成距离矩阵;
23)采用离差平方和法(Ward variance minimization algorithm)进行层次聚类,计算公式如式(2):
其中,d(u,v)为簇u和v合并之后的离差平方和增量,簇u是由簇s和t组成的新簇,簇v是还未合并的簇,|*|为对应簇中原子簇的个数,T=|v|+|s|+|t|为簇u和v合并后原子簇的个数,通过合并簇u和v,使得新簇内离差平方和增量d(u,v)最小,即最初切达奶酪特征风味组合的距离矩阵中28个原子簇各成一簇,每次簇合并使得新簇的离差平方和增加,选择离差平方和增量最小的两簇进行合并,直到所有原子簇都在一个簇中。
切达奶酪特征风味组分层次聚类结果如图2,根据聚类结果选择不同簇个数,计算距离簇中心最近的风味化合物作为用于分类的身份标识性特征风味组分,不同的身份标识性特征风味组分如表1。
表1不同的切达奶酪身份标识性特征风味组分
3)未知切达奶酪级别的判定;
利用支持向量机(Support Vector Machine,SVM)模型判别未知切达奶酪级别,根据不同的切达奶酪身份标识性特征风味组分,将21个待测样本输入支持向量机模型进行分类,通过五折交叉验证得到准确率和f1-score,f1-score是精确率(precision)和召回率(recall)的一种调和平均数,越高说明分类模型性能越好,如图3,当簇个数为8时,切达奶酪身份标识性特征风味组分为己酸乙酯、癸醛、2-甲基-丙酸、γ-十二内酯、己酸、2-庚酮、月桂酸乙酯、δ-壬内酯,分类器效果最好,准确率、f1-score均高达95%,能够很好的区分负样本和识别正样本,判定未知的切达奶酪级别。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (7)
1.一种基于层次聚类提取特征的切达奶酪身份判别标识方法,包括如下步骤:
1)对切达奶酪的特征风味组分进行确定并定量;执行如下操作:
11)采用香气提取物稀释分析方法AEDA测定多个不同级别的切达奶酪的特征风味组分,每种特征风味组分均为挥发性香气物质,得到每种挥发性香气物质的香气稀释因子;
12)制备特征风味组分的标准曲线;
将香气提取物稀释分析方法AEDA选出的多个特征风味组分的香气标准品,按照其浓度范围选取浓度点计算标准曲线;即将酸性化合物溶于正己烷,同理,将中性或碱性化合物按其在奶酪中的大致浓度范围配置并溶于10ml正己烷中,在此基础上做出28种特征风味组分标准曲线;所述酸性化合物包括:乙酸、2-甲基-丙酸、丁酸、3-甲基-丁酸、戊酸、己酸、庚酸、壬酸;所述中性或碱性化合物包括:2,3-丁二酮、丁酸乙酯、2-庚酮、柠檬烯、己酸乙酯、2-壬酮、辛酸乙酯、癸醛、苯甲醛、2-十一烷酮、癸酸乙酯、月桂醛、δ-己内酯、月桂酸乙酯、δ-壬内酯、呋喃酮、酱油酮、δ-癸内酯、γ-十二内酯、δ-十二内酯;
13)检测得到样品中的特征风味组分含量;
气质条件为:取1μL待测切达奶酪样品的溶剂辅助风味蒸发法SAFE的提取物,进行气相色谱质谱联用分析;执行如下操作:
13a)GC条件:采用DB-WAX毛细管柱,氦气作为载气;
13b)设定色谱柱升温程序;
13c)质谱条件:采用电子电离源,电离能量为70eV,离子源温度为230℃,接口温度为250℃,四极杆温度150℃,检测器温度为280℃,扫描模式全扫描,质量范围m/z为20~350;
13d)得到的样品中的特征风味组分含量数据由MassHunter化学工作站进行数据处理;
将待鉴定的特征风味化合物与保留指数Ri进行对比,并根据每种化合物的标准曲线对待鉴定的特征风味化合物进行精确定量;
保留指数Ri的测定方法具体是:在色谱条件相同的情况下,将正构烷烃C7~C40与切达奶酪在相同的色谱条件下得出GC保留时间,并根据式1计算待测物i的保留指数:
其中,RI—保留指数;n—碳原子数;ti—为样品i的保留时间;tn—碳原子数为n的正构烷烃的保留时间;tn+1—碳原子数为n+1的正构烷烃的保留时间;tn<ti<tn+1;
13e)定性分析所得挥发性化合物,并根据内标浓度对化合物进行定量;
2)对多种特征风味组分进行层次聚类,生成身份标识性特征风味组分模型;
进行层次聚类的方法是:通过计算28种风味组分两两之间的斯皮尔曼spearman相关系数形成28×28规模的距离矩阵,距离矩阵中每一列作为一个原子簇,然后合并原子簇为越来越大的簇,直到所有原子簇都在一个簇中,或者某个终结条件被满足;具体执行如下操作:
21)根据步骤1)中的方法,从多个切达奶酪样本获取切达奶酪样本的风味组分化合物的浓度数据,样本级别分布包括:淡味、中味、浓味;
22)计算特征风味组分两两之间的斯皮尔曼spearman相关系数,形成距离矩阵;
23)采用离差平方和法进行层次聚类,表示如式2:
其中,d(u,v)为簇u和v合并之后的离差平方和增量,簇u是由簇s和t组成的新簇,簇v是还未合并的簇,|*|为对应簇中原子簇的个数,T=|v|+|s|+|t|为簇u和v合并后原子簇的个数;
通过合并簇u和v,使得新簇内离差平方和增量d(u,v)最小,即最初切达奶酪特征风味组合的距离矩阵中28个原子簇各成一簇,每次簇合并使得新簇的离差平方和增加,选择离差平方和增量最小的两簇进行合并,直到所有原子簇都在一个簇中,得到切达奶酪特征风味组分的层次聚类结果;
根据聚类结果选择不同簇个数,计算距离簇中心最近的风味化合物,作为用于分类的身份标识性特征风味组分;
3)利用支持向量机SVM模型判别未知切达奶酪的级别;执行如下操作;
根据不同的切达奶酪身份标识性特征风味组分,将多个待测样本输入支持向量机SVM模型进行分类,通过交叉验证,得到准确率和f1-score,从而区分负样本和识别正样本,判定未知的切达奶酪级别。
2.如权利要求1所述基于层次聚类提取特征的切达奶酪身份判别标识方法,其特征是,步骤11)具体通过溶剂辅助风味蒸发法SAFE,对切达奶酪样品的挥发性分为组分进行萃取,得到浓缩液;将得到的浓缩液用正己烷按1:3进行系列稀释,每次稀释后的溶液进入气相-嗅闻装置GC-O进行分析,直到在嗅探口末端不再闻到任何气味则停止稀释;每种挥发性香气物质的最高稀释倍数即为香气稀释因子;每个稀释倍数的样品分析三次,有两次以上在同一嗅闻时间有相同感官描述即为有效结果。
3.如权利要求1所述基于层次聚类提取特征的切达奶酪身份判别标识方法,其特征是,步骤11)通过AEDA方法确定得到切达奶酪中共有28种特征风味组分。
4.如权利要求1所述基于层次聚类提取特征的切达奶酪身份判别标识方法,其特征是,步骤12)制备特征风味组分的标准曲线,具体将选定化合物使用14点计算标准曲线,最小回归偏差大于0.92。
5.如权利要求1所述基于层次聚类提取特征的切达奶酪身份判别标识方法,其特征是,步骤13a)GC条件中,采用DB-WAX毛细管柱为30m×0.25mm,0.25μm;氦气作载气,使用1mL/min恒定流速;
色谱柱升温程序设定为:起始柱温35℃,保持5min,溶剂延迟4min,以5℃/min升到100℃,保持2min,然后以6℃/min升到180℃,最后以8℃/min升到230℃,保持2min;采用不分流模式,进样口温度为250℃。
6.如权利要求1所述基于层次聚类提取特征的切达奶酪身份判别标识方法,其特征是,步骤3)具体将21个待测样本输入支持向量机模型进行分类,通过五折交叉验证,得到准确率和f1-score。
7.如权利要求6所述基于层次聚类提取特征的切达奶酪身份判别标识方法,其特征是,层次聚类的簇个数为8,识别的切达奶酪身份标识性特征风味组分分别为己酸乙酯、癸醛、2-甲基-丙酸、γ-十二内酯、己酸、2-庚酮、月桂酸乙酯、δ-壬内酯;支持向量机分类器的准确率、f1-score均高达95%。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811002830.2A CN109115908B (zh) | 2018-08-30 | 2018-08-30 | 基于层次聚类提取特征的切达奶酪身份的判别标识方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811002830.2A CN109115908B (zh) | 2018-08-30 | 2018-08-30 | 基于层次聚类提取特征的切达奶酪身份的判别标识方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109115908A CN109115908A (zh) | 2019-01-01 |
CN109115908B true CN109115908B (zh) | 2021-07-20 |
Family
ID=64860566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811002830.2A Expired - Fee Related CN109115908B (zh) | 2018-08-30 | 2018-08-30 | 基于层次聚类提取特征的切达奶酪身份的判别标识方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109115908B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110082458B (zh) * | 2019-05-31 | 2022-05-03 | 北京工商大学 | 切达奶酪挥发性物质与感官品质级别相关性识别方法 |
CN114125847B (zh) * | 2020-08-27 | 2023-12-15 | 东北大学秦皇岛分校 | 泛在电力物联网下一种基于设备指纹的终端身份认证方法 |
CN113257365B (zh) * | 2021-05-26 | 2022-07-12 | 南开大学 | 面向非标准化单细胞转录组测序数据的聚类方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101706489A (zh) * | 2009-11-30 | 2010-05-12 | 内蒙古蒙牛乳业(集团)股份有限公司 | 一种建立原奶产品感官品评专家系统的方法 |
CN107782827B (zh) * | 2017-11-30 | 2020-05-22 | 天津味沁百家科技发展有限公司 | 一种奶酪特征风味物质分析方法及其指纹图谱 |
-
2018
- 2018-08-30 CN CN201811002830.2A patent/CN109115908B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN109115908A (zh) | 2019-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109115908B (zh) | 基于层次聚类提取特征的切达奶酪身份的判别标识方法 | |
CN110687240B (zh) | 一种快速鉴定火腿产地的方法 | |
CN105334279B (zh) | 一种高分辨质谱数据的处理方法 | |
CN108181263B (zh) | 基于近红外光谱的烟叶部位特征提取及判别方法 | |
US20070023642A1 (en) | Apparatus and method for processing of mass spectrometry data | |
WO2017045296A1 (zh) | 在线近红外样本量确定方法 | |
CN111044638A (zh) | 一种对不同品种烤烟烟叶分类鉴别的方法 | |
CN103134850A (zh) | 一种基于特征香气的茶叶品质快速检测装置及检测方法 | |
CN109738569B (zh) | 一种基于spme-gc-ms的高仿卷烟鉴别方法 | |
CN109668992A (zh) | 一种霉变烟叶识别方法 | |
CN111060642A (zh) | 一种对同品种不同产地烟叶分类鉴别的方法 | |
CN105651892B (zh) | 一种基于gc-msqqq的卷烟指纹图谱分析方法 | |
CN111208251B (zh) | 一种白茶年份判别方法 | |
CN109164180B (zh) | 基于决策树提取特征判别马苏里拉奶酪身份标识的方法 | |
CN114611582B (zh) | 一种基于近红外光谱技术分析物质浓度的方法及系统 | |
CN108445134B (zh) | 酒类产品鉴别的方法 | |
CN111505174A (zh) | 一种鉴别真假烟的方法 | |
CN114994202A (zh) | 一种基于gc-ims技术的大蒜产地鉴别方法 | |
CN116699040A (zh) | 一种包装印刷品中关键气味成分的分析方法及数据库 | |
CN111289451B (zh) | 复杂光谱组分浓度定量计算的方法 | |
CN111337452A (zh) | 一种验证光谱数据模型转移算法可行性的方法 | |
CN113607850A (zh) | 一种利用挥发性有机物分析鉴定小麦品种的方法 | |
CN113378755B (zh) | 基于等高线地图的气相离子迁移谱数据谱峰自动识别方法 | |
CN117969700A (zh) | 一种快速靶向检测原料乳风味品质的方法 | |
CN114563491B (zh) | 一种监测阿胶加工工艺中样品质量变化的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210720 |