CN113447457B - 一种快速鉴别霉变烟草最优势霉菌种类的方法 - Google Patents
一种快速鉴别霉变烟草最优势霉菌种类的方法 Download PDFInfo
- Publication number
- CN113447457B CN113447457B CN202110093586.0A CN202110093586A CN113447457B CN 113447457 B CN113447457 B CN 113447457B CN 202110093586 A CN202110093586 A CN 202110093586A CN 113447457 B CN113447457 B CN 113447457B
- Authority
- CN
- China
- Prior art keywords
- mould
- tobacco
- species
- mold
- dominant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 241000208125 Nicotiana Species 0.000 title claims abstract description 99
- 235000002637 Nicotiana tabacum Nutrition 0.000 title claims abstract description 99
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000012360 testing method Methods 0.000 claims abstract description 69
- 239000003085 diluting agent Substances 0.000 claims abstract description 31
- 230000003595 spectral effect Effects 0.000 claims abstract description 28
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims abstract description 22
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 22
- 238000007637 random forest analysis Methods 0.000 claims abstract description 19
- 238000012258 culturing Methods 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 230000001580 bacterial effect Effects 0.000 claims abstract description 10
- 241000894007 species Species 0.000 claims description 44
- 238000001228 spectrum Methods 0.000 claims description 42
- 241000894006 Bacteria Species 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 33
- 238000000354 decomposition reaction Methods 0.000 claims description 17
- 239000000203 mixture Substances 0.000 claims description 11
- 239000012898 sample dilution Substances 0.000 claims description 8
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 239000000758 substrate Substances 0.000 claims description 6
- 238000012300 Sequence Analysis Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000001514 detection method Methods 0.000 abstract description 9
- 239000002207 metabolite Substances 0.000 abstract description 7
- 238000004497 NIR spectroscopy Methods 0.000 abstract description 6
- 241000233866 Fungi Species 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 239000012895 dilution Substances 0.000 description 8
- 238000010790 dilution Methods 0.000 description 8
- 238000002329 infrared spectrum Methods 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 238000003066 decision tree Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 241000228212 Aspergillus Species 0.000 description 4
- 238000010521 absorption reaction Methods 0.000 description 4
- 238000010009 beating Methods 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 241000228197 Aspergillus flavus Species 0.000 description 3
- 241001225321 Aspergillus fumigatus Species 0.000 description 3
- 241000228143 Penicillium Species 0.000 description 3
- 241000228150 Penicillium chrysogenum Species 0.000 description 3
- 241000228153 Penicillium citrinum Species 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 229940091771 aspergillus fumigatus Drugs 0.000 description 3
- 238000007865 diluting Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 241000228245 Aspergillus niger Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 238000004477 FT-NIR spectroscopy Methods 0.000 description 2
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 2
- 238000004566 IR spectroscopy Methods 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- 238000012864 cross contamination Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 240000006439 Aspergillus oryzae Species 0.000 description 1
- 235000002247 Aspergillus oryzae Nutrition 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000235526 Mucor racemosus Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 241000235527 Rhizopus Species 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000012136 culture method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002504 physiological saline solution Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000012306 spectroscopic technique Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种快速鉴别霉变烟草最优势霉菌种类的方法,将霉变烟叶样本稀释液用快速霉菌酵母测试片压片、培养,运用近红外光谱法对快速霉菌酵母测试片上的菌落及其特征代谢产物进行表征以获得若干个光谱数据,利用离散小波变换算法对光谱数据进行预处理,得到若干个小波系数重构光谱数据,然后,利用随机森林算法从小波系数重构光谱数据中识别不同种类最优势霉菌的特征信息,从而建立最优势菌种识别模型,通过最优势菌种鉴别模型鉴别霉变烟草的最优势霉菌种类。该方法具有前处理步骤简单,对操作人员要求低,实用性较高,检测速度快,预测准确率高的优点。
Description
技术领域
本发明涉及霉变烟草霉菌种类鉴定技术领域,尤其涉及一种基于快速霉菌酵母测试片和NIR技术快速鉴别霉变烟草最优势霉菌种类的方法。
背景技术
霉菌属于真菌类微生物,在自然界中的分布十分广泛。烟草作为一种农产品,即使是经过高温烘烤,依然会有霉菌孢子残留在叶片上。在运输和储存过程中,如果遇到适合霉菌生长的温湿度环境,烟草则很容易出现霉变。而霉变会使烟叶结构被破坏,香气消失,刺激性增大,并产生苦涩、霉臭味,严重影响烟叶质量。
以往对烟叶霉变的质量控制手段通常为霉菌计数,然而霉菌的种类有很多,并不是所有种类的霉菌都具有较大的危害,因此单纯的霉菌计数并不能对烟草的食品安全性做出客观全面的评估。烟草上常见霉菌分为多个属种,如黄曲霉、烟曲霉、黑曲霉和桔青霉等,不同的属种发展成最优势菌群后其危害性有所差异。
现有的最优势霉菌种类鉴别方法有形态学法、代谢产物检测法、免疫测定法和rDNA-ITS序列分析法。以上方法都有各自的优点,但也各有不同的缺陷。其中,形态学法存在检测周期比较长的问题,一般需要7~10天,而且,灵敏度受到杂菌干扰。代谢产物检测法、免疫测定法和rDNA-ITS序列分析法则都需要复杂的前处理步骤,对实验人员、试剂、设备和环境的要求也相对较高,且分别存在提取和净化效果不理想、特异性抗体制备难度大、测序结果比对工作量大等问题。
光谱技术是近年来发展迅速的分析技术之一,其中傅里叶变换红外光谱(Fouriertransform infrared spectroscopy,FTIR)、拉曼光谱(Raman spectra,RS)和傅里叶变换近红外光谱(Fourier transform near infrared spectroscopy,FT-NIR)技术在微生物研究领域取得了一些成果,在食品、制药等很多行业中有一定的应用。
现有基于光谱技术的霉菌研究有两类,一类仍停留在利用近红外技术预判霉变程度,并没有深入到菌种鉴别的层面,另一类是采集单一种类的干菌粉或孢子悬浮液光谱图,利用PCA、LDA或PLS-DA等方法建立分类模型,该类方法仅能扫描纯种菌种进行鉴别,检测时仍需要进行漫长的菌种分离、冻干菌粉制备等前处理步骤,操作过程繁琐,应用场景狭窄,实用性较低。
因此,目前亟需研究出具有处理步骤简单,实用性较高,检测速度快,预测准确率高的优点的快速鉴别霉变烟草最优势霉菌种类的方法。
发明内容
本发明提供了一种快速鉴别霉变烟草最优势霉菌种类的方法,用于解决现有快速鉴别霉变烟草最优势霉菌种类的方法处理步骤复杂、实用性较低、检测速度慢且预测准确率低的技术问题。
有鉴于此,本发明提供了一种快速鉴别霉变烟草最优势霉菌种类的方法,包括以下步骤:
将预先采集的已知最优势霉菌种类的霉变烟叶样品制备成若干个不同浓度的霉菌样品稀释液;
通过快速霉菌酵母测试片对若干个所述霉菌样品稀释液进行压片、培养,从而获得若干个具有不同组成信息的含菌测试片,所述组成信息包括最优势霉菌种类、烟叶成分基底和稀释液浓度;
通过近红外光谱仪对若干个所述含菌测试片进行光谱采集,从而获得若干个光谱数据;
基于离散小波变换算法对若干个所述光谱数据进行预处理,从而得到若干个小波系数重构光谱数据;
将若干个所述小波系数重构光谱数据作为训练集,将所述训练集代入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型;
通过所述最优势菌种鉴别模型鉴别霉变烟草的未知最优势霉菌种类。
优选地,所述将预先采集的已知最优势霉菌种类的霉变烟叶样品制备成若干个不同浓度的霉菌样品稀释液之前的步骤包括:
选取若干份不同年份、不同产地和不同等级的复烤烟叶样品;
将若干份所述复烤烟叶样品互相隔开后分别放置于恒温恒湿环境下进行人工霉变,从而获得若干份霉变烟叶样品;
通过分别对若干份所述霉变烟叶样品进行菌种鉴别,获得各个所述霉变烟叶样品对应的最优势霉菌的种属信息。
优选地,所述通过分别对若干份所述霉变烟叶样品进行菌种鉴别的方法为形态学法或rDNA-ITS序列分析法。
优选地,所述恒温恒湿环境具体的温度为25±2℃,湿度为80±5%。
优选地,所述将预先采集的已知最优势霉菌种类的霉变烟叶样品制备成若干个不同浓度的霉菌样品稀释液具体包括:
在无菌环境下,将所述霉变烟叶样品放入均质袋中,加入灭菌生理盐水,然后,进行拍打均质制成10–1浓度的霉菌样品稀释液,将10–1浓度的霉菌样品稀释液依次用灭菌生理盐水分别稀释得到10–2浓度、10–3浓度和10–4浓度的霉菌样品稀释液;
重复上述操作,从而使每份所述霉变烟叶样品均获得四个不同浓度的霉菌样品稀释液。
优选地,所述通过快速霉菌酵母测试片对若干个所述霉菌样品稀释液进行压片、培养具体包括:通过快速霉菌酵母测试片分别对四个不同浓度的所述霉菌样品稀释液进行压片后,再于28±2℃温度环境下培养2.5~3天。
优选地,所述通过快速霉菌酵母测试片对若干个所述霉菌样品稀释液进行压片、培养,从而获得若干个具有不同组成信息的含菌测试片之后包括:
根据预设的菌落浓度阈值对若干个所述含菌测试片进行筛选,从而筛选出满足所述预设的菌落浓度阈值的含菌测试片。
优选地,所述近红外光谱仪的光谱采集范围为4000~12000cm-1,分辨率为8cm-1,扫描次数为64次。
优选地,所述离散小波变换算法的最佳小波基函数为db2,最佳小波分解层数为3。
优选地,所述将若干个所述小波系数重构光谱数据作为训练集,将所述训练集带入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型具体包括:
随机选取2/3的所述小波系数重构光谱数据作为训练集,剩余的1/3的所述小波系数重构光谱数据作为测试集,将所述训练集代入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型,将所述测试集代入所述最优势菌种鉴别模型中验证模型准确性。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明提供了一种快速鉴别霉变烟草最优势霉菌种类的方法,将霉变烟叶样本稀释液用快速霉菌酵母测试片压片、培养,运用近红外光谱法对快速霉菌酵母测试片上的菌落及其特征代谢产物进行表征以获得若干个光谱数据,利用离散小波变换算法对光谱数据进行预处理,得到若干个小波系数重构光谱数据,然后,利用随机森林算法从小波系数重构光谱数据中识别不同种类最优势霉菌的特征信息,从而建立最优势菌种识别模型,通过最优势菌种鉴别模型鉴别霉变烟草的最优势霉菌种类。该方法克服了以往红外及近红外光谱法只能通过扫描单一纯种菌种才能鉴别霉菌种类的缺陷,且无需进行长时间的菌种分离,直接扫描霉变烟叶样本稀释液压制的含菌测试片便可鉴别最优势霉菌种类,具有前处理步骤简单,对操作人员要求低,实用性较高,检测速度快,预测准确率高的优点。
附图说明
图1为本发明实施例提供的一种快速鉴别霉变烟草最优势霉菌种类的方法的流程图;
图2为本发明另一实施例提供的一种快速鉴别霉变烟草最优势霉菌种类的方法的流程图;
图3为本发明实施示例中不同最优势霉菌种类的含菌测试片光谱图;
图4为本发明实施示例中分解层数为1的小波系数重构光谱图;
图5为本发明实施示例中分解层数为2的小波系数重构光谱图;
图6为本发明实施示例中分解层数为3的小波系数重构光谱图;
图7为本发明实施示例中分解层数为4的小波系数重构光谱图;
图8为本发明实施示例中分解层数为5的小波系数重构光谱图;
图9为本发明实施示例中分解层数为6的小波系数重构光谱图;
图10为本发明实施示例中基于不同小波基函数和分解层数的训练集总识别正确率的折线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了便于理解,请参阅图1,本发明提供的一种快速鉴别霉变烟草最优势霉菌种类的方法,包括以下步骤:
S100:将预先采集的已知最优势霉菌种类的霉变烟叶样品制备成若干个不同浓度的霉菌样品稀释液;
S200:通过快速霉菌酵母测试片对若干个霉菌样品稀释液进行压片、培养,从而获得若干个具有不同组成信息的含菌测试片,组成信息包括最优势霉菌种类、烟叶成分基底和稀释液浓度;
S300:通过近红外光谱仪对若干个含菌测试片进行光谱采集,从而获得若干个光谱数据;
S400:基于离散小波变换算法对若干个光谱数据进行预处理,从而得到若干个小波系数重构光谱数据;
S500:将若干个小波系数重构光谱数据作为训练集,将训练集带入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型;
S600:通过最优势菌种鉴别模型鉴别霉变烟草的未知最优势霉菌种类。
本实施例将霉变烟叶样本稀释液用快速霉菌酵母测试片压片、培养,运用近红外光谱法对快速霉菌酵母测试片上的菌落及其特征代谢产物进行表征以获得若干个光谱数据,利用离散小波变换算法对光谱数据进行预处理,得到若干个小波系数重构光谱数据,然后,利用随机森林算法从小波系数重构光谱数据中识别不同种类最优势霉菌的特征信息,从而建立最优势菌种识别模型,通过最优势菌种鉴别模型鉴别霉变烟草的最优势霉菌种类。该方法克服了以往红外及近红外光谱法只能通过扫描单一纯种菌种才能鉴别霉菌种类的缺陷,且无需进行长时间的菌种分离,直接扫描霉变烟叶样本稀释液压制的含菌测试片便可鉴别最优势霉菌种类,具有前处理步骤简单,对操作人员要求低,实用性较高,检测速度快,预测准确率高的优点。
以上为本发明提供的一种快速鉴别霉变烟草最优势霉菌种类的方法的一个实施例的详细描述,以下为本发明提供的一种快速鉴别霉变烟草最优势霉菌种类的方法的另一个实施例的详细描述。
为了方便理解,请参阅图2,本发明提供的一种快速鉴别霉变烟草最优势霉菌种类的方法,包括以下步骤:
S201:选取若干份不同年份、不同产地和不同等级的复烤烟叶样品;
S202:将若干份复烤烟叶样品互相隔开后分别放置于恒温恒湿环境下进行人工霉变,从而获得若干份霉变烟叶样品;
在本实施例中,恒温恒湿环境具体的温度为25±2℃,湿度为80±5%。
同时,每份复烤烟叶样品之间互相隔开以免交叉污染。
S203:通过分别对若干份霉变烟叶样品进行菌种鉴别,获得各个霉变烟叶样品对应的最优势霉菌的种属信息;
在本实施例中,通过分别对若干份所述霉变烟叶样品进行菌种鉴别的方法为形态学法或rDNA-ITS序列分析法。同时,种属信息作为后续建模的基础数据。
S204:在无菌环境下,将霉变烟叶样品放入均质袋中,加入灭菌生理盐水,然后,进行拍打均质制成10–1浓度的霉菌样品稀释液,将10–1浓度的霉菌样品稀释液依次用灭菌生理盐水分别稀释得到10–2浓度、10–3浓度和10–4浓度的霉菌样品稀释液;
S205:重复步骤S204操作,从而使每份霉变烟叶样品均获得四个不同浓度的霉菌样品稀释液;
S206:通过快速霉菌酵母测试片分别对四个不同浓度的霉菌样品稀释液进行压片后,再于28±2℃温度环境下培养2.5~3天,从而获得若干个具有不同组成信息的含菌测试片,组成信息包括最优势霉菌种类、烟叶成分基底和稀释液浓度;
在本实施例中,组成信息还包括其他杂菌信息和测试片成分基底,同时,温度环境还可为28±3℃,优选为28±1℃;培养天数还可为2.5~5天,但更优选为2.5~3天。
可以理解的是,选择快速霉菌酵母测试片作为霉菌培养和光谱扫描的载体的优势有以下几点:一是其基底背景相对单纯,使得本方法具有一定的泛用性,不仅限于烟草领域,本方法还可应用于其他食品领域。二是菌种在快速霉菌酵母测试片的培养时间比传统培养基培养法短,前处理步骤也不包含菌种分离、冻干粉制备等,这能明显缩短检测时间。三是菌种在测试片上能够比干菌粉和孢子悬浮液留下更完整的代谢产物信息,使得最终采集到的光谱信息更加丰富且更具特异性。四是可使霉菌鉴种和计数同步进行,将计数用的测试片直接进行光谱扫描即可预测出最优势菌种类型。
同时,不同的菌种在不同的温湿度环境的生长速度不同,可调整不同的温湿度环境进行人工霉变实验,以获得更多种类的最优势菌种样本以扩充模型覆盖范围。
S207:根据预设的菌落浓度阈值对若干个含菌测试片进行筛选,从而筛选出满足预设的菌落浓度阈值的含菌测试片;
可以理解的是,部分稀释液由于稀释倍数高,制得的压片含菌过少,甚至是不含菌,不适宜用来扫描建模,因此需要将其剔除,从而筛选出满足预设的菌落浓度阈值的含菌测试片。
S208:通过近红外光谱仪对若干个含菌测试片进行光谱采集,从而获得若干个光谱数据;
在本实施例中,近红外光谱仪的光谱采集范围为4000~12000cm-1,分辨率为8cm-1,扫描次数为64次。
S209:基于离散小波变换算法对若干个光谱数据进行预处理,从而得到若干个小波系数重构光谱数据;
在本实施例中,离散小波变换算法的最佳小波基函数为db2,最佳小波分解层数为3。
需要说明的是,小波变换算法是一种高效的信号处理方法,其是把信号分解成各个不同尺度和位移的小波,具有傅里叶不存在的多分辨率分析特征。
本实施例利用小波变换算法将傅里叶近红外光谱数据在频域内进行多尺度分解,获得相对应的低频小波系数及高频小波系数。其中,低频小波系数主要显示信号的近似分量,高频系数则主要显示为细节分量和大部分噪声分量。通过在不同尺度上的分解去噪和重构信号,可为后续建立的最优势霉菌种类模型去除干扰信息,提供更加纯净的信号基础。
S210:基于随机森林算法从若干个小波系数重构光谱数据中识别不同种类最优势霉菌的特征信息;
需要说明的是,随机森林(Random forest,RF)是一种将决策树和Bootstrap重抽样方法结合起来的一种分类算法。它用Bagging方法生成有差异的训练集,并在此基础上引入随机选择属性,在本实施例中,随机森林中得决策树数量(ntree)取500,决策树节点树数量(mtry)取总变量数的平方根。
S211:随机选取2/3的小波系数重构光谱数据作为训练集,剩余的1/3的小波系数重构光谱数据作为测试集,将训练集代入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型,将测试集代入最优势菌种鉴别模型中验证模型准确性;
S212:通过最优势菌种鉴别模型鉴别霉变烟草的未知最优势霉菌种类。
以下为本发明提供的一种快速鉴别霉变烟草最优势霉菌种类的方法的一个实施示例的详细描述。
1.1试验材料
复烤烟:选取137份不同年份、不同产地、不同等级的复烤烟叶,由广东中烟工业有限责任公司提供。
PetrifilmTM快速快速霉菌酵母测试片(美国3M公司),全过滤型均质袋(interscience公司),氯化钠(分析纯,国药集团化学试剂有限公司),乙醇(分析纯,国药集团化学试剂有限公司)。
1.2仪器设备
MPA傅立叶变换近红外光谱仪(德国Bruker公司),BSA224S-CW电子天平(Sartorious公司),KBF恒温恒湿箱(Binder公司),BA-2S拍打式无菌均质器(上海本昂科学仪器有限公司),Double Biocao RNA/DNA超净台(Erlab公司)。
1.3霉变烟叶样品的制备
取137份复烤烟叶样品分别放置在温度25±2℃,湿度80±5%的恒温恒湿箱中进行人工霉变,每份样品之间互相隔开以免交叉污染。烟叶发霉后,用形态学法进行菌种鉴别,获得最主要的最优势霉菌属种基础数据。
在本示例中的137份霉变烟草样本中,检出的最优势霉菌覆盖了3个属7个种,其中属包括曲霉属(Aspergillus)、青霉属(Penicillium)和毛霉属(Mucor)和根霉属(Rhizopus)。曲霉属中覆盖了4个种,分别为黄曲霉(Aspergillus flavus)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)和烟曲霉(Aspergillusfumigatus),青霉属覆盖了2个种,分别为桔青霉(Penicillium citrinum)和产黄青霉(Penicillium Chrysogenum),毛霉属检出的是总状毛霉(Mucorracemosus)。
在所有的最优势霉菌样本中,检出率最高的为曲霉,其次为青霉,曲霉中又以黄曲霉最常见。
1.4含菌测试片样本的制备
在无菌环境下,将霉变烟叶放入均质袋中,按霉变烟叶和灭菌生理盐水之间质量比为1:9的比例加入灭菌生理盐水,并放在拍打式无菌均质器上拍打1min,制成10–1浓度的霉变样品稀释液。
将10–1浓度的霉菌样品稀释液依次用灭菌生理盐水分别稀释得到10–2浓度、10–3浓度和10–4浓度的霉菌样品稀释液,使每份霉变烟叶样品共获得四个梯度浓度的霉菌样品稀释液。
用快速快速霉菌酵母测试片对四个梯度浓度的霉菌样品稀释液分别进行压片,于28±2℃培养2.5~3天,以便能获得具有不同最优势霉菌种类、不同烟叶成分基底、不同稀释液浓度信息的含菌测试片。
将霉变样本分别用生理盐水稀释成不同的倍数后用测试片进行压制和培养。同一个厂商生产的空白快速霉菌酵母测试片的基底是相同的,不同的压片由于霉变样品烟叶化学成分、稀释液倍数、最优势霉菌种类等各有差异,其呈现出的底色、菌落的大小和密度也不一样,经肉眼判断无法直接识别霉菌种类。
同时,部分稀释液由于稀释倍数高,制得的压片含菌过少,甚至是不含菌,不适宜用来扫描建模,因此需要将其剔除含菌过少和不含菌的测试片,筛选出菌落浓度适宜的测试片。试验最终获得428份含菌测试片样本,含菌测试片样本的具体最优势霉菌种类信息见表1。
表1含菌测试片样本的具体最优势霉菌种类信息
1.5近红外光谱扫描
将428份含菌测试片剪成与近红外专用样品杯内径匹配的圆形,正面朝下平整的放入近红外专用样品杯中并压上压样器,然后将样品杯放置在近红外光谱仪的旋转台上进行光谱扫描,从而获得若干个含有各种信息的傅里叶近红外光谱数据。
其中,光谱扫描的参数为:光谱采集范围4000~12000cm-1,分辨率8cm-1,扫描次数64次。
1.6NIR数据预处理
由于近红外光谱仪采集到的近红外光谱数据信号除了待测成分信息外,还包含了高频随机噪声、基线漂移和杂散光等无关信息,因此需要采用数学前处理方法减少系统噪声。
由于物质在近红外谱区的吸收主要是包括C-H,N-H,O-H,S-H,C=O,C=C在内的有机分子基团基频振动的合频和倍频振动吸收,而不同最优势霉菌的细胞、孢子及代谢产物等的化学组分均有各自的特异性,因此不同的最优势霉菌在近红外光谱吸收应当有所差异。
然而,如图3所示,近红外光谱吸收峰重叠十分严重,多组分复杂样品的近红外光谱不是各组分单独光谱的叠加,单纯从谱图中无法直观的识别不同最优势霉菌的差异,因此需要用化学计量学从复杂的光谱中提取有效信息。
本实施示例是通过离散小波变换算法(DWT)对若干个傅里叶近红外光谱数据进行预处理,为了获得更佳的预处理效果,需要选择合适的小波基函数和分解层数,和傅里叶变换相比,小波变换算法有着很多的小波基可选,同一个信号在不同的小波基上进行展现会有不同的分解效果。在实际应用中,通常是根据分解后的最终数据和理论效果之间存在的误差来判断小波基的合适度。
常用的小波基函数有Haar、Daubechies、Symlets、Coiflets和Biorthogonal等,其中Daubechies小波系简称dbN,其具有较好的正则性,随着小波分解级数的增加,小波函数的消失矩增大,小波更加光滑,在时域的紧支撑性降低,在频域的局部性增加。
本实施示例将428份光谱数据的约2/3划分为训练集,1/3作为测试集,采用不同的Daubechies小波系(db1,db2,db3,…,db6)和小波分解层数(1~6)对原始光谱进行处理,得到若干个不同的小波系数重构光谱数据,如图4~9所示,图4~9分别为当离散小波变换算法中的小波基函数为db2时,分解层数为1~6层得到的不同小波系数cd1、cd2、cd3、cd4、cd5、cd6的重构光谱d1、d2、d3、d4、d5、d6。
1.7建立最优势菌种鉴别模型
基于随机森林算法从若干个小波系数重构光谱数据中识别不同种类最优势霉菌的特征信息;
随机选取小波系数重构光谱数据作为训练集,通过10折交叉验证方法考察不同光谱预处理条件下训练集的分类正确率,其中,森林中决策树数量(ntree)取默认值500,决策树节点树数量(mtry)取总变量数的平方根,基于训练集代入随机森林模型中训练,从而构建最优势菌种鉴别模型。
如图10所示,从图10可以看出,当小波基函数为db2,分解层数为3时,模型分析效果最优,训练集总识别正确率达到98.25%,远高于直接用原始光谱建模得到的正确率(78.13%),证明优化后的小波变换算法作为本实施示例的光谱预处理方法是非常有效的。
表2是不同小波系数在1~6层中取最优层数时,训练集7种最优势霉菌分别的识别正确率(表中分别以正确率1,正确率2,正确率3,…,正确率6表示当小波基函数为db1,db2,db3,…db6时的识别正确率)。从表2可以看出,不同的模型对黄曲霉和桔青霉的鉴别正确率均能达到100%,其他5种霉菌的识别正确率有所差异,经db5和db6小波基函数处理所建随机森林模型在烟曲霉的识别正确率方面表现较差,只有74.07%和80.95%。经db2小波基处理所建模型对产黄青霉的识别正确率较高,达到91.64%,基于其他小波基的均低于90%。因此,本实施示例最终确定以优化后的小波变换算法(小波基函数db2,小波分解层数3)为近红外光谱预处理方法为最优预处理方法。
表2不同小波系数下训练集7种最优势霉菌鉴别结果
1.8最优势菌种鉴别模型验证
为了验证优化后的RF模型分类性能,本实施示例对测试集样本进行了预测,预测结果见表3。从表3可以看出,在143个测试集样本中,仅有1个最优势菌为产黄青霉的样本被误报,总预测正确率达到99.30%,正确率极高。
表3基于最优势菌种鉴别模型测试集7种最优势霉菌预测结果
为了进一步验证本方法建立的最优势菌种鉴别模型的有效性,从复烤烟仓库或复烤厂中收集了12个实际中已发霉的复烤烟和初烤烟样品作为外部预测集进行验证。将收集到的发霉烟叶样品制成10-1浓度的稀释液后进行压片后,在28±2℃恒温恒湿箱内培养3天后制成含菌测试片,用最优势菌种鉴别模型对含菌测试片进行预测,对比数据由形态学法鉴定。表4是本方法所建的最优势菌种鉴别模型对外部的含菌测试片(预测集)的最优势菌种的预测结果,从表4可以看出,本方法所建的最优势菌种鉴别模型对实际中的12个发霉烟叶样品的最优势霉菌种类鉴别结果与形态学结果一致,可见该最优势菌种鉴别模型能够实现对实际发霉样品的准确鉴别。
同时,在实际最优势菌种鉴别过程中,只需要将发霉烟叶样品制成1~2种浓度的稀释液,进行压片、培养后,用近红外扫描获得光谱数据,即可通过最优势菌种鉴别模型预测发霉烟叶样品种最优势霉菌种类结果。其操作简便且鉴别效率较高。
表4最优势菌种鉴别模型对外部预测集的预测结果对比
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,包括以下步骤:
选取若干份不同年份、不同产地和不同等级的复烤烟叶样品;
将若干份所述复烤烟叶样品互相隔开后分别放置于恒温恒湿环境下进行人工霉变,从而获得若干份霉变烟叶样品;
通过分别对若干份所述霉变烟叶样品进行菌种鉴别,获得各个所述霉变烟叶样品对应的最优势霉菌的种属信息;
将预先采集的已知最优势霉菌种类的霉变烟叶样品制备成若干个不同浓度的霉菌样品稀释液;
通过快速霉菌酵母测试片对若干个所述霉菌样品稀释液进行压片、培养,从而获得若干个具有不同组成信息的含菌测试片,所述组成信息包括最优势霉菌种类、烟叶成分基底和稀释液浓度;
通过近红外光谱仪对若干个所述含菌测试片进行光谱采集,从而获得若干个光谱数据;
基于离散小波变换算法对若干个所述光谱数据进行预处理,从而得到若干个小波系数重构光谱数据;
将若干个所述小波系数重构光谱数据作为训练集,将所述训练集代入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型;
通过所述最优势菌种鉴别模型鉴别霉变烟草的未知最优势霉菌种类。
2.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述通过分别对若干份所述霉变烟叶样品进行菌种鉴别的方法为形态学法或rDNA-ITS序列分析法。
3.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述恒温恒湿环境具体的温度为25±2℃,湿度为80±5%。
4.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述通过快速霉菌酵母测试片对若干个所述霉菌样品稀释液进行压片、培养具体包括:通过快速霉菌酵母测试片分别对四个不同浓度的所述霉菌样品稀释液进行压片后,再于28±2℃温度环境下培养2.5~3天。
5.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述通过快速霉菌酵母测试片对若干个所述霉菌样品稀释液进行压片、培养,从而获得若干个具有不同组成信息的含菌测试片之后包括:
根据预设的菌落浓度阈值对若干个所述含菌测试片进行筛选,从而筛选出满足所述预设的菌落浓度阈值的含菌测试片。
6.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述近红外光谱仪的光谱采集范围为4000~12000 cm -1,分辨率为8 cm -1,扫描次数为64 次。
7.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述离散小波变换算法的最佳小波基函数为db2,最佳小波分解层数为3。
8.根据权利要求1所述的快速鉴别霉变烟草最优势霉菌种类的方法,其特征在于,所述将若干个所述小波系数重构光谱数据作为训练集,将所述训练集代入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型具体包括:
随机选取2/3的所述小波系数重构光谱数据作为训练集,剩余的1/3的所述小波系数重构光谱数据作为测试集,将所述训练集代入随机森林模型中训练,从而识别不同种类最优势霉菌的特征信息,进而构建最优势菌种鉴别模型,将所述测试集代入所述最优势菌种鉴别模型中验证模型准确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110093586.0A CN113447457B (zh) | 2021-01-22 | 2021-01-22 | 一种快速鉴别霉变烟草最优势霉菌种类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110093586.0A CN113447457B (zh) | 2021-01-22 | 2021-01-22 | 一种快速鉴别霉变烟草最优势霉菌种类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113447457A CN113447457A (zh) | 2021-09-28 |
CN113447457B true CN113447457B (zh) | 2023-01-03 |
Family
ID=77808860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110093586.0A Active CN113447457B (zh) | 2021-01-22 | 2021-01-22 | 一种快速鉴别霉变烟草最优势霉菌种类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113447457B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080102487A1 (en) * | 2006-11-01 | 2008-05-01 | Institute For Technology Development | Method and apparatus for non-invasive rapid fungal specie (mold) identification having hyperspectral imagery |
CN104237235A (zh) * | 2014-09-15 | 2014-12-24 | 江苏大学 | 基于近红外成像技术的食源性致病菌的快速检测方法 |
CN106770004A (zh) * | 2016-11-22 | 2017-05-31 | 福建医科大学 | 基于近红外光谱技术检测乳制品中微生物的种类和含量的方法 |
CN110363119A (zh) * | 2019-06-28 | 2019-10-22 | 广东中烟工业有限责任公司 | 基于小波变换-随机森林算法的烟叶霉变快速识别方法 |
-
2021
- 2021-01-22 CN CN202110093586.0A patent/CN113447457B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113447457A (zh) | 2021-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Geographical traceability of wild Boletus edulis based on data fusion of FT-MIR and ICP-AES coupled with data mining methods (SVM) | |
Pang et al. | Rapid vitality estimation and prediction of corn seeds based on spectra and images using deep learning and hyperspectral imaging techniques | |
Lecellier et al. | Differentiation and identification of filamentous fungi by high-throughput FTIR spectroscopic analysis of mycelia | |
Longley et al. | Fungal and bacterial community dynamics in substrates during the cultivation of morels (Morchella rufobrunnea) indoors | |
CN107796782B (zh) | 基于烟叶特征光谱一致性度量的复烤质量稳定性评价方法 | |
Williams et al. | Growth characteristics of three Fusarium species evaluated by near-infrared hyperspectral imaging and multivariate image analysis | |
Lu et al. | Evaluation and classification of five cereal fungi on culture medium using Visible/Near-Infrared (Vis/NIR) hyperspectral imaging | |
Salman et al. | Identification of fungal phytopathogens using Fourier transform infrared-attenuated total reflection spectroscopy and advanced statistical methods | |
Wang et al. | Method superior to traditional spectral identification: FT-NIR two-dimensional correlation spectroscopy combined with deep learning to identify the shelf life of fresh phlebopus portentosus | |
CN1556412A (zh) | 基于电子视觉和嗅觉融合技术的农畜产品无损检测方法及其装置 | |
CN106706546A (zh) | 一种基于红外和拉曼光谱数据的人工智能学习物质分析方法 | |
CN111243676B (zh) | 一种基于高通量测序数据的枯萎病发病预测模型及应用 | |
Qi et al. | Fourier transform mid-infrared spectroscopy and chemometrics to identify and discriminate Boletus edulis and Boletus tomentipes mushrooms | |
Treguier et al. | Identification of lactic acid bacteria Enterococcus and Lactococcus by near-infrared spectroscopy and multivariate classification | |
CN110363119A (zh) | 基于小波变换-随机森林算法的烟叶霉变快速识别方法 | |
CN108801971A (zh) | 基于高光谱成像技术的霉菌侵染板栗的检测方法 | |
Dean et al. | Molecular response of Anabaena flos‐aquae to differing concentrations of phosphorus: A combined Fourier transform infrared and X‐ray microanalytical study | |
Smedsgaard et al. | Terverticillate penicillia studied by direct electrospray mass spectrometric profiling of crude extracts. I. Chemosystematics | |
CN113447457B (zh) | 一种快速鉴别霉变烟草最优势霉菌种类的方法 | |
Yao et al. | Fusion of ultraviolet and infrared spectra using support vector machine and random forest models for the discrimination of wild and cultivated mushrooms | |
CN104297136A (zh) | 一种基于高光谱图像对铜绿假单胞杆菌生长预测的方法 | |
CN110887921B (zh) | 一种高效快速分析杜仲叶及其发酵产物特征挥发性成分的方法 | |
Bounphanmy et al. | Discrimination of cyanobacterial strains isolated from saline soils in Nakhon Ratchasima, Thailand using attenuated total reflectance FTIR spectroscopy | |
CN115963074A (zh) | 一种微生物材料孢子菌丝占比的快速检测方法和系统 | |
Schmidtke et al. | Discrimination of Aspergillus spp., Botrytis cinerea, and Penicillium expansum in grape berries by ATR-FTIR spectroscopy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |