CN106645530B - 一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法 - Google Patents
一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法 Download PDFInfo
- Publication number
- CN106645530B CN106645530B CN201611162141.9A CN201611162141A CN106645530B CN 106645530 B CN106645530 B CN 106645530B CN 201611162141 A CN201611162141 A CN 201611162141A CN 106645530 B CN106645530 B CN 106645530B
- Authority
- CN
- China
- Prior art keywords
- sample
- principal component
- tobacco
- similarity
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8696—Details of Software
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Manufacture Of Tobacco Products (AREA)
Abstract
本发明涉及一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法,属于烟草技术领域。本发明的方法是通过蒙特卡洛无放回采样,随机选取一定比例的样本作为训练集,剩下的样本作为模型内部验证集;建立多个基于烟叶致香成分含量的主成分模型;利用内部验证集样本对模型的有效性进行验证;将新烟叶原料的致香成分数据输入经验证有效的主成分模型,计算样品在多个模型中的马氏距离,对生成的马氏距离数据组进行分析,评价新的烟叶原料与原料库中烟叶原料的相似度。本发明与一次建模计算相似度方法相比较,更能充分提取所有样品致香成分数据信息,也更能兼顾原料库中烟叶样品致香成分含量的差异性数据信息。
Description
技术领域
本发明涉及一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法,属于烟草技术领域。具体是以某一品牌卷烟涉及烟叶原料的致香成分为基础数据,通过构建烟叶原料相似度多模型评价体系,实现新烟叶原料与原库中烟叶原料相似度评价,为挑选合适烟叶进入原料库,维护烟叶原料库供需平衡,保持同一品牌卷烟的风格特征提供辅助信息。
背景技术
面对国内外烟草消费市场的新形势,“卷烟上水平”已成为我国烟草行业发展的基本方针和战略任务。“卷烟上水平”就必须保证烟叶原料供应上水平,以品牌为导向的烟叶原料配置在烟叶原料供应上水平中发挥着重要的作用。品牌导向的烟叶原料配置就需要为同一品牌的卷烟配置特用的烟叶原料库。当烟叶库存用完,进行烟叶原料替代时需要选择与替代样品感官评吸相似度高,又与其它烟叶原料的感官相似度高的烟叶样品,以保持同一品牌卷烟在抽吸风格特征上的一致性。
烟叶致香成分的种类和含量是卷烟风格特征的物质基础。中国专利CN201210388661采用卷烟的致香物含量进行逐步回归分析,建立了卷烟香型的定量化判定标准。中国专利CN201310551840通过对烟叶特征化学指标的筛选和取舍,然后进行主成分计算,建立了烟叶风格特征TQ的计算公式。上述两个专利揭示了烟叶致香成分在保持卷烟风格特征方面发挥着重要作用。因此如何保持新挑选的烟叶原料必须与原料库中烟叶原料在致香成分含量整体性上较高的相似度就显得尤为重要。
中国专利CN200810030798基于烟叶的化学成分,采用主成分分析和马氏距离搜索评价相似烟叶。中国专利CN201210344034基于烟叶的近红外信息,采用主成分分析和马氏距离判定相似烟叶样品,辅助卷烟配方。上述两个专利揭示了主成分分析能从整体性上较好的揭示多维烟草化学成分分析的整体性信息,马氏距离能有效的计算两个未知样本集的相似度。
以上技术中,采用一次建模的主成分分析和马氏距离计算和评价烟叶样本相似度,存在以下不足:由于主成分模型中各样本间存在一定的差异性,将所有样品进行一次性建模难以排除与其它样品差异性较大的个别样品对主成分分析模型整体性的影响。一次性建模所采用的训练集难以完全代表所有样本的总体信息。
蒙特卡洛采样是一种无放回采样,也称刀切法(Jack knife),机选取一定比例的样本作为训练集,剩下的样本作为独立测试集。进行蒙特卡洛采样时需要设定采样次数、训练集和内部验证集样品个数的比例划分。蒙特卡洛采样能较好兼顾数据的整体性信息和差异性信息。
马氏距离的计算公式: ,式中:为平均得分矩阵,为马氏矩阵M的逆矩阵, 。 为样本集中i样本的得分矢量,为i样本的马氏距离。
发明内容
本发明的目的在于建立一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法。本发明的意义在于:弥补一次建模的不足,使烟叶原料相似度评价更加科学和合理。
本发明的方法是通过蒙特卡洛无放回采样,随机选取一定比例的样本作为训练集,剩下的样本作为模型内部验证集;建立多个基于烟叶致香成分含量的主成分模型;利用内部验证集样本对模型的有效性进行验证;将新烟叶原料的致香成分数据输入经验证有效的主成分模型,计算样品在多个模型中的马氏距离,对生成的马氏距离数据组进行分析,评价新的烟叶原料与原料库中烟叶原料的相似度。
为实现上述目的,本发明采用的技术方案如下:
基于某一品牌卷烟现在使用的烟叶原料,构建以卷烟品牌为导向的烟叶原料库,对原料库中某待替换的烟叶进行多次代表性取样,取样次数为N,每次取1个样品;之后,对取样得到N个烟叶样品采用同时蒸馏萃取-气相色谱/质谱联法测定其致香成分含量;
同时蒸馏萃取-气相色谱/质谱联法)参照王玉等发表《卷烟挥发性成分的聚类分析》文章方法测定其致香成分含量。
所测得的烟叶样品致香成分含量数据输入Matlab软件中构成基础数据矩阵;
基于基础数据矩阵,设定蒙特卡洛采样参数:采样次数为N/3、训练集样本个数为①中所取得样品个数的80%、内部验证集样本个数为①中所取得样品个数的20%。根据设定好的参数,在Matlab软件采用蒙特卡洛采样方法采样,划分得到N/3个主成分模型训练集和对应的内部验证集。
对N/3个主成分模型训练集进行主成分分析,构建主成分模型,并将对应的内部验证集样本数据输入构建好的主成分模型中,计算各内部验证集样本的马氏距离。
主成分模型内部验证有效性的判定规则为:所有内部验证样本在主成分模型中计算得到马氏距离的最大值不得超过2为有效,否则为无效。该规则用于排除原料库中致香成分含量与其它样品差异较大的样品对整个主成分模型易产生偏差造成的影响。
根据中的判定规则,判定建立的N/3个主成分模型的有效性,得到有效的主成分模型。
将M个需要评价的新烟叶原料致香成分数据输入中验证有效的主成分模型,分别计算马氏距离,组成M个马氏距离数据组。
计算需要评价烟叶原料马氏距离数据组的平均值和标准偏差。
比较不同样品中计算得到的马氏距离的平均值和标准偏差的大小,根据验证样品相似度评价规则对样品的相似度进行对比评价。
验证样品相似度评价规则:(1)以马氏距离平均值小的样品判定为相似度高;(2)当两样品马氏距离差值小于或等于±0.05时,以标准偏差小的样品判定为相似度高。本发明方法的流程图1所示。
本发明与现有技术相比,其有益效果为:
(1)较一次建模计算相似度,选取所有样品进行分组主成分分析,建立多模型计算烟叶原料相似度方法,更能充分提取所有样品致香成分数据信息。
(2)较一次建模计算相似度,将样品进行不同组合后进行主成分分析,建立多模型计算烟叶原料相似度方法,更能兼顾原料库中烟叶样品致香成分含量的差异性数据对整体数据信息的影响。
(3)采用同一训练集中的不同子集建立多个模型同时进行预测,将多个预测结果通过简单平均作为最终的预测结果,可获得更高的预测精度和稳定性。
附图说明
图1为本发明方法的流程图。
图2为实施例1中第1个验证有效主成分模型主成分得分图。
图3为实施例1中9个相似度评价样本的马氏距离分布图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过购买获得的常规产品。
实施例1
以2014年9个云南地区烟叶与市售某品牌卷烟原料库中某待替换烟叶取样得到的60个烟叶样品的相似度评价为例进行说明。
(1)采用同时蒸馏萃取结合气相色谱/质谱联用仪(GC/MS)参照王玉等发表《卷烟挥发性成分的聚类分析》文章方法测定9个云南地区烟叶及市售某品牌卷烟原料库中某待替换烟叶取样得到的60个烟叶样品的致香成分含量,致香成分信息如表1所示。
表1 烟叶原料中致香成分信息
(2)将步骤(1)中测得的60个烟叶样品的致香成分含量数据导入matlab软件中,构成基础数据矩阵。
(3)设定采样次数为20,采用蒙特卡洛采样方法,得到20个主成分模型训练集及对应的内部验证集。每个训练集样本个数48,内部验证集样本个数为12。
(4)分别对20个主成分模型训练集进行主成分分析,构建得到20个主成分模型;之后将与构建主成分模型所用的训练集对应的内部验证集的样本输入该主成分模型中,计算内部验证集样本的马氏距离;(即采用主成分模型训练集1构建主成分模型1,然后将内部验证集1中所有的样本输入到主成分模型1中,计算各个内部验证集1样本的马氏距离;采用主成分模型训练集2构建主成分模型2,然后将内部验证集2中所有的样本输入到主成分模型2中,计算各个内部验证集2样本的马氏距离;以此类推。)
20个主成分模型内部验证集样品马氏距离的最大值、最小值、平均值如表2所示
表2 20个主成分模型内部验证集样品马氏距离的最大值、最小值、平均值及模型有效性
(5)主成分模型内部验证有效性判定规则:所有内部验证样本在主成分模型中计算得到马氏距离的最大值不得超过2为有效,否则为无效。
根据主成分模型内部验证有效性判定规则,判定建立的20个主成分模型的有效性,判定得到有效模型14个,无效模型6个。第1个验证有效主成分模型第1-2主成分得分图如图2所示。
(6)以2014年9个云南地区烟叶作为需要评价的新烟叶原料,将2014年9个云南地区烟叶的致香成分数据导入14个有效模型中计算马氏距离,如表3所示。9个相似度评价样本的马氏距离分布如图3所示。
表3 2014年9个云南地区烟叶在14个有效模型中马氏距离的平均值及标准偏差
(7)根据验证样品相似度评价判定规则:(1)以马氏距离平均值小的样品判定为相似度高;(2)当两样品马氏距离差值小于或等于±0.05时,以标准偏差小的样品判定为相似度高。判定2014年9个云南地区烟叶与原料库中某叶组配方等级烟叶样品相似度从高到低排序为:6、2、3、5、8、9、4、1、7。上述结果表明:在致香成分含量上,6号样品与欲被替代的样品具有更高相似性,6号样品为替代样品的最优选择。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。
Claims (3)
1.一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法,其特征在于,包括如下步骤:
步骤(1),基于某一品牌卷烟现在使用的烟叶原料,构建以卷烟品牌为导向的烟叶原料库,对原料库中某待替换的烟叶进行多次代表性取样,取样次数为N,每次取一个样品;之后,对取样得到N个烟叶样品采用同时蒸馏萃取-气相色谱/质谱联用 法测定其致香成分含量;
步骤(2),将步骤(1)所测得的烟叶样品致香成分含量数据输入Matlab软件中构成基础数据矩阵;
步骤(3),基于步骤(2)构成的基础数据矩阵设定蒙特卡洛采样参数:采样次数为N/3、训练集样本个数为步骤(1)中取得样品个数的80%、内部验证集样本个数为步骤(1)中取得样品个数的20%;
根据设定好的参数,在Matlab软件采用蒙特卡洛采样方法采样,得到N/3个主成分模型训练集和对应的内部验证集;
步骤(4),对N/3个主成分模型训练集进行主成分分析,构建主成分模型,并将对应的内部验证集样本数据输入构建好的主成分模型中,计算各内部验证集样本的马氏距离;
步骤(5),根据主成分模型内部验证有效性判定规则,判定建立的N/3个主成分模型的有效性,得到有效的主成分模型;
步骤(6),将M个需要评价的新烟叶原料的致香成分数据输入步骤(5)中得到的有效的主成分模型,分别计算马氏距离,组成M个马氏距离数据组;
步骤(7),计算步骤(6)中各个马氏距离数据组的平均值和标准偏差;
步骤(8),对步骤(7)中计算得到的所有的马氏距离的平均值和标准偏差的大小进行比较,根据验证样品相似度评价规则对M个需要评价新烟叶原料与待替换叶的相似度进行评价,取相似度最高的新烟叶原料替换待替换叶。
2.根据权利要求1所述的基于烟叶致香成分的多模型评价烟叶原料相似度的方法,其特征在于,步骤(5)主成分模型内部验证有效性判定规则为:所有内部验证样本在主成分模型中计算得到马氏距离的最大值不得超过2为有效,否则为无效。
3.根据权利要求1所述的基于烟叶致香成分的多模型评价烟叶原料相似度的方法,其特征在于,步骤(8)验证样品相似度评价规则:(1)以马氏距离平均值小的样品判定为相似度高;(2)当两样品马氏距离平均值差值小于或等于±0.05时,以标准偏差小的样品判定为相似度高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611162141.9A CN106645530B (zh) | 2016-12-15 | 2016-12-15 | 一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611162141.9A CN106645530B (zh) | 2016-12-15 | 2016-12-15 | 一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106645530A CN106645530A (zh) | 2017-05-10 |
CN106645530B true CN106645530B (zh) | 2018-07-24 |
Family
ID=58822515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611162141.9A Active CN106645530B (zh) | 2016-12-15 | 2016-12-15 | 一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106645530B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109115692B (zh) * | 2018-07-04 | 2021-06-25 | 北京格致同德科技有限公司 | 一种光谱数据分析方法及装置 |
CN111610290A (zh) * | 2020-04-16 | 2020-09-01 | 云南中烟工业有限责任公司 | 一种香精香料近似度量化评价方法 |
CN114062303B (zh) * | 2020-07-31 | 2023-11-24 | 上海烟草集团有限责任公司 | 烟叶均匀性的监控方法、系统、介质及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251523A (zh) * | 2008-03-12 | 2008-08-27 | 湖南中烟工业有限责任公司 | 一种基于烟叶化学成分的相似烟叶搜索方法 |
CN101393182B (zh) * | 2008-10-23 | 2011-07-27 | 红云红河烟草(集团)有限责任公司 | 一种烟草及其制品香味品质的测定方法 |
CN102866127A (zh) * | 2012-09-17 | 2013-01-09 | 福建中烟工业有限责任公司 | 一种基于近红外光谱信息的simca辅助卷烟配方的方法 |
-
2016
- 2016-12-15 CN CN201611162141.9A patent/CN106645530B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101251523A (zh) * | 2008-03-12 | 2008-08-27 | 湖南中烟工业有限责任公司 | 一种基于烟叶化学成分的相似烟叶搜索方法 |
CN101393182B (zh) * | 2008-10-23 | 2011-07-27 | 红云红河烟草(集团)有限责任公司 | 一种烟草及其制品香味品质的测定方法 |
CN102866127A (zh) * | 2012-09-17 | 2013-01-09 | 福建中烟工业有限责任公司 | 一种基于近红外光谱信息的simca辅助卷烟配方的方法 |
Non-Patent Citations (3)
Title |
---|
FTIR-ATR指纹图谱的主成分分析-马氏距离法应用于烟用香精质量控制;王家俊等;《光谱学与光谱分析》;20070531;第27卷(第5期);第895~898页 * |
基于近红外光谱投影及蒙特卡洛方法的烟叶配方比例上限分析;米津锐等;《光谱学与光谱分析》;20110430;第31卷(第4期);第915~919页 * |
烟叶中六种成分OSC-PCR定量模型的研究;吴丽君等;《光谱学与光谱分析》;20130630;第33卷(第6期);第1.4节,第2.2节 * |
Also Published As
Publication number | Publication date |
---|---|
CN106645530A (zh) | 2017-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104931430B (zh) | 一种复烤片烟自然醇化品质评价及模型构建方法 | |
CN106645530B (zh) | 一种基于烟叶致香成分的多模型评价烟叶原料相似度的方法 | |
CN103217408B (zh) | 一种鉴别贵州两类不同香型烤烟的方法 | |
CN103070465B (zh) | 一种基于配伍性的烟叶组合物混配方法 | |
CN105136736B (zh) | 在线近红外样本量确定方法 | |
CN108181263B (zh) | 基于近红外光谱的烟叶部位特征提取及判别方法 | |
CN105954366B (zh) | 一种烟用香精香料品质监控方法 | |
CN105842402A (zh) | 一种打叶复烤均匀性的评价方法 | |
CN105092789B (zh) | 一种片烟醇化过程中烟叶风格特征变化趋势分析方法 | |
CN110132879A (zh) | 一种基于近红外光谱的烤烟香韵鉴别方法 | |
CN109840698A (zh) | 一种卷烟感官质量的对比评价方法及其应用 | |
CN108132964A (zh) | 一种基于用户对项目类评分的协同过滤方法 | |
CN105956364A (zh) | 一种基于特征化学成分的烟叶判别分组方法 | |
CN110132880A (zh) | 一种基于近红外光谱的烟叶整体感官质量评价方法 | |
CN104680314A (zh) | 一种烟叶风格特征感官评价的方法 | |
CN111642782A (zh) | 一种基于卷烟配方需求的烟叶原料功效定位方法 | |
CN104705776B (zh) | 梗末混合提取的造纸法再造烟叶原料配方设计方法 | |
CN102435709A (zh) | 一种准确鉴定烤烟香型的方法 | |
CN111680910A (zh) | 一种基于卷烟配方功效的烟叶适用范围定位方法 | |
CN102680427A (zh) | 一种应用近红外光谱分析技术鉴别卷烟表香质量的方法 | |
CN107797527B (zh) | 一种均质化调控方法、系统、及具有该系统的服务器 | |
CN108828139A (zh) | 一种烟用香精香料评价方法 | |
CN102175819A (zh) | 基于烟叶致香成分表征单体烟叶风格特征的方法 | |
CN106198861B (zh) | 一种量化评价卷烟烟丝与保润剂配伍性的方法 | |
CN109781870B (zh) | 一种鉴别烤烟香型的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |