CN107014769A - 一种基于THz光谱分析的鲜肉K值快速无损检测模型 - Google Patents
一种基于THz光谱分析的鲜肉K值快速无损检测模型 Download PDFInfo
- Publication number
- CN107014769A CN107014769A CN201710167175.5A CN201710167175A CN107014769A CN 107014769 A CN107014769 A CN 107014769A CN 201710167175 A CN201710167175 A CN 201710167175A CN 107014769 A CN107014769 A CN 107014769A
- Authority
- CN
- China
- Prior art keywords
- sample
- ann
- thz
- spectrum
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 90
- 235000013372 meat Nutrition 0.000 title claims abstract description 64
- 238000004458 analytical method Methods 0.000 title claims abstract description 17
- 238000013210 evaluation model Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000012549 training Methods 0.000 claims abstract description 30
- 238000004611 spectroscopical analysis Methods 0.000 claims abstract description 28
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 21
- 230000003595 spectral effect Effects 0.000 claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 9
- 230000001419 dependent effect Effects 0.000 claims abstract description 8
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 210000005036 nerve Anatomy 0.000 claims abstract description 5
- 230000002441 reversible effect Effects 0.000 claims abstract description 5
- 238000002834 transmittance Methods 0.000 claims abstract description 5
- 238000013507 mapping Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 18
- 210000002569 neuron Anatomy 0.000 claims description 16
- 230000008569 process Effects 0.000 claims description 15
- 238000002790 cross-validation Methods 0.000 claims description 10
- 238000004128 high performance liquid chromatography Methods 0.000 claims description 10
- 238000002310 reflectometry Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 9
- 238000005259 measurement Methods 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 7
- 230000014509 gene expression Effects 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 4
- 238000005102 attenuated total reflection Methods 0.000 claims description 3
- 230000005284 excitation Effects 0.000 claims description 3
- 238000011835 investigation Methods 0.000 claims description 2
- 239000007791 liquid phase Substances 0.000 claims description 2
- 238000005457 optimization Methods 0.000 claims description 2
- 235000015277 pork Nutrition 0.000 description 22
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 15
- 239000000126 substance Substances 0.000 description 14
- 238000012360 testing method Methods 0.000 description 11
- 238000010521 absorption reaction Methods 0.000 description 10
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 8
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- GRSZFWQUAKGDAV-UHFFFAOYSA-N Inosinic acid Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(NC=NC2=O)=C2N=C1 GRSZFWQUAKGDAV-UHFFFAOYSA-N 0.000 description 7
- 235000013902 inosinic acid Nutrition 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- VLTRZXGMWDSKGL-UHFFFAOYSA-N perchloric acid Chemical compound OCl(=O)(=O)=O VLTRZXGMWDSKGL-UHFFFAOYSA-N 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 5
- 238000009659 non-destructive testing Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 4
- 235000020997 lean meat Nutrition 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000009825 accumulation Methods 0.000 description 3
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000009795 derivation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical group O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 239000007788 liquid Substances 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 235000013622 meat product Nutrition 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 3
- 239000012071 phase Substances 0.000 description 3
- 238000005064 physico chemical analysis method Methods 0.000 description 3
- 238000012628 principal component regression Methods 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 229910021642 ultra pure water Inorganic materials 0.000 description 3
- 239000012498 ultrapure water Substances 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 239000007853 buffer solution Substances 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 230000001066 destructive effect Effects 0.000 description 2
- 239000000796 flavoring agent Substances 0.000 description 2
- 235000019634 flavors Nutrition 0.000 description 2
- 235000021393 food security Nutrition 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000011068 loading method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 229910052757 nitrogen Inorganic materials 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- AUHDWARTFSKSAC-HEIFUQTGSA-N (2S,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-(6-oxo-1H-purin-9-yl)oxolane-2-carboxylic acid Chemical compound [C@]1([C@H](O)[C@H](O)[C@@H](CO)O1)(N1C=NC=2C(O)=NC=NC12)C(=O)O AUHDWARTFSKSAC-HEIFUQTGSA-N 0.000 description 1
- 101150029019 ATP6 gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000218636 Thuja Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 229940126678 chinese medicines Drugs 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013524 data verification Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 238000010812 external standard method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 238000002329 infrared spectrum Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 229940028843 inosinic acid Drugs 0.000 description 1
- 239000004245 inosinic acid Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000005374 membrane filtration Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000037368 penetrate the skin Effects 0.000 description 1
- 229920000768 polyamine Polymers 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
- 238000012372 quality testing Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000009738 saturating Methods 0.000 description 1
- 239000013049 sediment Substances 0.000 description 1
- 210000000697 sensory organ Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 235000012976 tarts Nutrition 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 229910000404 tripotassium phosphate Inorganic materials 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3563—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/3581—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation
- G01N21/3586—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using far infrared light; using Terahertz radiation by Terahertz time domain spectroscopy [THz-TDS]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- Chemical & Material Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Toxicology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
一种基于THz光谱分析的鲜肉K值快速无损检测模型,模型的建模步骤包括:1)构建多层反向传播神经网络BP‑ANN:采用THz衰减全反射ATR检测模式对鲜肉样本的THz光谱进行取样,并对样本光谱数据进行处理;把BP‑ANN视为非线性函数,BP‑ANN输入和预测值分别为该非线性函数的自变量和因变量,BP‑ANN表达了从自变量到因变量的函数映射关系;2)训练包括:网络初始化;隐含层输出计算;输出层输出计算;误差计算;权值更新;阈值更新;根据迭代次数和最终迭代误差判断算法迭代是否结束。本发明通过探索鲜肉新鲜度的THz光谱特性,建立THz光谱数据与鲜肉新鲜度K值之间的关系模型,实现对鲜肉K值的快速无损检测。
Description
技术领域
本技术方案属于鲜肉检测技术领域,具体是一种基于THz光谱分析的鲜肉K值快速无损检测模型。
背景技术
肉是人们主要的蛋白质、脂肪等的摄取源。鲜肉的新鲜程度在食品安全中尤其重要。以猪肉为例,它是我国肉制品消费的主要种类,我国猪肉消费量占肉类消费总量的77%,如何控制生产销售环节中的肉品质、保证食品安全,受到了生产企业、消费者和国家质检部门的高度关注。猪、牛、羊、鱼肉等鲜肉的品质包括营养成分、风味、嫩度、保水性和新鲜度等要素,其中,新鲜度是一个重要的方面。
新鲜度测定通常有两种方法,感官评定法和理化分析法。感官评定法主观因素大,重复性差;理化分析法精确可信,重复性高。理化分析所测定的新鲜度指标包括肉色、微生物指标、挥发性盐基总氮指标、K值、pH值和聚胺类化合物等,其中,基于ATP分解过程的K值被证实是可行的且受到越来越多的重视。
鲜肉中的一些物质随保存时间的增加而变质,在宰后的肉品中,三磷酸腺苷(ATP)会自动分解,过程为:三磷酸腺苷(ATP)→二磷酸腺苷(ADP)→磷酸腺苷(AMP)→次黄嘌呤核苷酸(IMP)→肌苷酸(HxR)→次黄嘌呤(Hx)。
据ATP分解过程,有如下测定K值的指标方程:
式中ATP、ADP、AMP、IMP、HxR、Hx——各物质在样品中的含量
肉品越是新鲜K值越低,反之K值越高。K值通常可以采用高效液相色谱分析法(High Performance Liquid Chromatography,HPLC)获得。虽然此种理化分析法准确且可信,但是过程耗时、对被测样品具有破坏性,不能满足生产和流通环节中的快速和广泛性测量要求,用无损检测方法测定猪肉的K值正成为科研工作的一个重要研究热点。
目前,鲜肉新鲜度指标的无损检测方法有近红外光谱分析、可见-近红外高光谱图像分析、电子鼻技术等。光谱分析法基于与鲜肉新鲜度相关的化学物质在可见和近红外波段有特征表达的原理,建立起无损检测猪肉新鲜度的数学模型,实现了新鲜度的快速和比较准确的测定。但是近红外光谱仪实验过程中,需要对样品仓抽真空处理,无法实现在线快速检测,光纤式光谱仪虽然不需要抽真空处理,但是需要用光纤采集样本的光谱信息,耦合光纤细小,检测区域有限,无法实现对样本表面的一次性全面采集。可见-近红外高光谱图像分析技术虽然能够实现全面采集,但是每次试验开始前以及长时间试验过程中,都需要用标准反射率标定板对光谱采集系统进行校准,以防止相机感光器件的温度漂移以及光源的亮度变化对检测系统的影响,不利于在线连续检测。电子鼻技术使用气体传感器采集肉的腐败气味,基于腐败程度越深、气味释放程度越强的原理测定肉的新鲜度,但是此方法需要将样品放置在密闭的检测仓中,并需要稳定放置一定时间,以使得检测仓中气味分布均匀,气味浓度达到传感器的检测下限,检测的等待时间长。
发明内容
太赫兹波(Terahertz,THz)位于毫米波和红外线之间,属于远红外波段,频率在0.1THz~10THz范围内(本案选择频率在0.1THz~2THz范围的太赫兹波)。从能量上看,THz波处于电子和光子之间。THz波的多元化特性使得很多化学分子在THz波段下表现出比在其它波段下所不具备的分子运动特性。核苷酸类(如ADP、ATP)及其相关物质(如IMP)属于生物小分子,在太赫兹波段的吸收主要是由于其分子自身的转动、振动或分子集团的整体振动,有太赫兹波谱特征结构,在THz波段存在多个吸收峰。
因此,本发明以K值为研究参数,通过探索鲜肉新鲜度的THz光谱特性,建立THz光谱数据与鲜肉新鲜度K值之间的关系模型,实现对鲜肉K值的快速无损检测,提出一种鲜肉新鲜度快速无损检测新方法,具体技术方案如下:
一种基于太赫兹(Terahertz,THz)光谱分析的鲜肉K值无损检测模型,其特征是本模型的建模步骤包括:步骤1)构建多层反向传播神经网络(Back Propagation ArtificialNeural Network,BP-ANN);步骤2)训练;
所述步骤1)中:
1.1)采用THz衰减全反射(Attenuated Total Reflectance,ATR)检测模式对鲜肉样本的THz光谱进行取样;对鲜肉样本的THz光谱进行取样得到样本光谱数据进行处理;
所有建模样本被随机分为校正集和预测集;(校正集中样本数和预测集中样本数的比约为2:1,)校正集的光谱数据用于建立预测模型;预测集的光谱数据用来检验预测模型的准确性。Xn×m是特指校正集中的光谱数据。
样本光谱数据矩阵为式中,n为校正集样本数,m为光谱波点数,x是样本的ATR反射率;
先对光谱信息进行压缩:把矩阵Xn×m分解为两个矩阵U和P,表示为Un×a=Xn×mPm×a;式中,矩阵U表示数据xij(i=1,2,…,n;j=1,2,…,m)在新的坐标体系中的矢量位置;矩阵P的列向量表示新的坐标系与原坐标系的线性变换系数;U的维数a小于X的维数m;取矩阵U的各行数据Ii(i=1,2,…,a)作为步骤1.2)的预测模型的输入;
1.2)把多层反向传播神经网络BP-ANN视为非线性函数,BP-ANN输入和预测值分别为该非线性函数的自变量和因变量,BP-ANN表达了从自变量到因变量的函数映射关系;
BP-ANN的拓扑结构由三层网络组成,分别是输入层、隐含层和输出层,每层包括多个神经元,相邻层的神经元之间是带权值的单向连接;
Ii是输入层的输入值,i=1,2,…,a;Hj是隐含层的输出值,j=1,2,…,b;输出层是一个节点 的值为BP-ANN的预测值,即鲜肉的预测K值;hwij为输入层的神经元与隐含层的神经元之间的连接权值,owj为隐含层的神经元与输出层的神经元之间的连接权值;
隐含层的节点数式中:a为输入层节点数,c为1~10范围内的常数,1为输出节点数;
所述步骤2)中,BP-ANN的训练步骤包括:
2.1)网络初始化:根据输入维数和输出维数确定a,b;初始化hwij、owj、隐含层阈值thaj、输出层阈值thb,权值和阈值是范围在-1~1的随机数;给定学习速率η,η=0.01;初始的权值和阈值是一个随机数,是通过下面的算法不断的迭代而最终获得一个最优模型下的最优权值和最优阈值。
2.2)隐含层输出计算:隐含层的输出式中,函数f(x)为隐含层激励函数,该函数的表达式为:
2.3)输出层输出计算:BP-ANN的预测输出
2.4)误差计算:BP-ANN的预测误差式中,y是采用HPLC方法实测的K值;
2.5)权值更新:hwij=hwij+ηHj(1-Hj)Iiowje,i=1,2,…,a;j=1,2,…,b;owj=owj+ηHje,j=1,2,…,b;
2.6)阈值更新:thaj=thaj+ηHj(1-Hj)owje,j=1,2,…,b;thb=thb+e;
2.7)根据迭代次数和最终迭代误差判断算法迭代是否结束,若没有结束,返回步骤2.2)。
所述步骤1.1)中,光谱频段为0.1THz~2THz。
步骤1)中,先对样本光谱数据进行预处理,预处理得到的数据作为矩阵X的数据;样本光谱数据进行预处理的方法为:
先采用一阶导数预处理光谱数据:式中,x是样本在波点数为i处的ATR反射率;当i=1时,其一阶微分值为当i=m时,其一阶微分值为
再采用SG多项式平滑光谱:选择奇数个光谱数据序列中相邻的数据点,由这些数据点构成一个窗口,对窗口的中心点进行平滑;平滑过程中,对窗口中的数据点拟合一个多项式(该多项式就是后文所述的多项式。),并根据所得该多项式对平滑的点进行计算;得到平滑后的数据点表达式为:式中,窗口的宽度为2d+1,s为常数,λj为SG平滑系数序列;
该多项式的拟合运用最小二乘方法。
模型的预测建模步骤还包括步骤3)模型改进与优化,把BP-ANN预测模型作为弱预测器进行优化,得到强预测器,步骤包括:
3.1)初始化:n为校正集的样本数,初始化校正集中训练数据的分布权重为Dt(j)=1/n(j=1,2,…,n),确定弱预测器预测误差的阈值Φ,根据样本的输入输出维数确定BP-ANN弱预测器结构,初始化网络参数;
3.2)训练弱预测器:训练第t个弱预测器时,用训练数据训练弱预测器,得到弱预测器输出的预测K值
然后计算预测误差(t=1,2,…,T),T是弱预测器的个数;
3.3)计算弱预测器的权重
3.4)调整训练数据分布权重并归一化:式中,
3.5)将3.2~3.4)步骤循环T次后,得到T个弱预测器,预测模型为ft。按更新的权重叠加,得到强预测器的预测模型
所述Φ值是采用留一交叉验证法选取模型的性能最好时的Φ值,即在一定范围内,以固定的步长,考察Φ取不同的值时,建模步骤在留一交叉验证法下的RMSECV的值,取RMSECV的值为最小时的Φ作为最优阈值;
留一交叉验证法的运算过程是:在校正集的n个样本中,每个样本都单独作为预测集,其余n-1个样本作为校正集;以校正集为依据,通过建模步骤得到这个预测集样本的预测值;经过n次循环,得到所有样本的预测值;
获得留一交叉验证法的性能指标RMSECV,
附图说明
图1是ATR附件光路示意图;
图2-1是HPLC测得的K值变化趋势图;
图2-2是一个肉样连续测量6次所得的6条THz原始光谱图;
图2-3是经SVSRS处理后的光谱图;
图3-1是80个样本的THz光谱原始谱线图;
图3-2是经过15点一阶求导和SG平滑后的THz光谱谱线图;
图4-1是不同的差分宽度下PCR模型的预测性能变化图;
图4-2是PCR模型的K值预测散点图;
图5-1是BP-ANN模型的结构图;
图5-2是BP-ANN模型的算法流程图;
图5-3是BP-ANN模型的RMSECV与差分宽度和隐含层节点数的关系图(RMSECV的最小值用红圈标注);
图5-4是BP-ANN模型的K值预测散点图;
图6-1是BP-ANN改进模型的算法流程图;
图6-2是BP-ANN改进模型中RMSECV与阈值Φ关系图(阈值Φ=0.05~0.25);
图6-3是BP-ANN改进模型中RMSECV与阈值Φ关系图(阈值Φ=0.13~0.14);
图6-4是BP-ANN改进模型的K值预测散点图。
具体实施方式
下面对本技术方案的研发、实验过程进行说明:
1、THz光谱本身特性:
太赫兹技术的一个显著特点是安全性。相比于X射线具有千电子伏的光子能量,太赫兹辐射的光子能量低于各种化学键的键能,因此它不会引起有害的电离反应。另外,由于水对太赫兹波有强烈的吸收,太赫兹辐射不能穿透人体的皮肤。因此即使强烈的太赫兹辐射,对人体的影响也只停留在皮肤表层,而不像微波可以穿透到人体的内部。THz安全性有利于设计出安全便捷的无损检测设备,并保护测试人员免受辐射危害。
太赫兹技术的另一个显著特点是光谱可分辨性。与近红外和中红外辐射相比,处于远红外波段的THz辐射的光子能量相对较低,但这一波段仍然包含了丰富的光谱信息。有机分子,由于其转动和振动(包括集体振动)的跃迁,在这一频段表现出强烈的吸收和色散特性。
2、鲜肉新鲜度K值相关的分子物质在THz波段的体现:
鲜肉新鲜度——K值测量的是核苷酸类(如ADP、ATP)及其相关物质(如IMP)的含量比,它们属于生物小分子,在太赫兹波段的吸收主要是由于其分子自身的转动、振动或分子集团的整体振动,其太赫兹波谱特征结构较为明晰。嘌呤多晶体在0.2~2.5THz波段存在多个吸收峰。
3、THz检测方式的选择:
由于生物分子中包含较多的原子,并且具有高密度的集合振动模式;分子中的各个原子之间的作用导致生物分子振动具有较大的非简谐性,因此生物分子的太赫兹光谱往往被非均匀展宽并重叠在一起。
可以采用两种方式解决这一问题。一种,使用低温冷却方式(如液氮冷却)压窄吸收峰的展宽,分离出各吸收峰,观察其吸收特征;另一种,在常温测量方式下获得THz谱线,对谱线使用多种预处理方式,比如标准正态变换(Standard Normal Variation,SNV)、多元散射校正(Multi-scatter Calibration,MSC)、导数(包括一阶导数和二阶导数)、Savitzky-Golay(SG)多项式平滑、小波变换等。尽量减少采集到的原始光谱中的高频随机噪声、基线漂移、光散射等噪声信息,使用线性或非线性数学模型分析谱线和被测物质的复杂关系,建立可靠和稳定的THz光谱分析模型。
考虑到本方案的目的是对被测鲜肉样品实现无损快速检测,应在常温方式下测量,所以选择后一种方式。
4、THz检测样本的选择
鲜肉(例如猪肉)样品中的表皮,肌肉和脂肪在THz波段下具有不同的折射率和透射率。将一块肉的切片中不同的组织成分——肥肉和瘦肉,放置于THz光谱分析系统中,在ATR反射模式的检测范围内(0.1至4THz),瘦肉的吸收系数大于肥肉的吸收系数,而且随着THz波的频率增加,两者之间的差异越来越大。可见,肉的不同组织成分,THz波的光谱差异较大。
一般来说,消费者在购买肉制品时更喜欢购买较瘦的肉,所以瘦肉的品质会决定着整个肉的品质。本技术方案选择样本中的瘦肉部分作为THz波谱的检测对象。
下面结合鲜猪肉的实施例对本方法进行进一步说明:
1、材料和方法
1.1试验材料
试验材料为冷鲜猪肉的通脊肉,每天上午从当地超市购买,用冷藏箱运回实验室后,将猪肉均匀切割成2.5cm×2.5cm×0.5cm的肉片。取样时避开猪肉的脂肪和结缔组织,以防止这些成分对THz检测结果的干扰。将猪肉样品用保鲜袋包好并编号后置于4℃冰柜中贮藏待测。连续采集8天的肉样,以日期先后为编号,依次为7d~0d。在0d的下午,完成8个肉样的THz光谱采集以及K值测定。重复试验10次,得到80个肉样的光谱数据和理化值。
1.2 THz光谱采集
THz检测设备的型号是TAS7500SP(ADVANTEST公司,日本),在室温环境下工作,频率分辨率为7.6GHz,检测频率范围是0.1THz~4THz,共498个采样频率点(波点),样品的谱线经过2048次自动扫描并平均后得到。
THz与水有强烈的相互作用,对于富含水的肉样透射深度只有几百微米,所以透射模式不适合肉制品新鲜度无损检测,反射模式也会因为反射波被水吸收而无法检测。用THz衰减全反射(Attenuated Total Reflectance,ATR)检测模式,可以克服样品中富含的游离水以及结合水对THz波的强烈吸收,使得样品表面微米级厚度化学物质的THz特性能够反映在THz全反射波的光谱里。ATR检测附件的光路如图1所示。
每个样品从冰箱取出后,去除包装,将样本平整放入ATR检测窗表面,如图1所示。样品的上下两个表面分别采集3次THz光谱数据,每个样本能够获得6份THz光谱数据,将6份光谱数据算术平均,作为该样本的最终THz光谱数据。因为THz光谱仪对温度和湿度比较敏感,所以光谱采集时,保持实验室内温度、湿度基本一致。
1.3 K值测定
采集完样本的THz光谱数据后立即对同一样本进行K值测定。采用HPLC方法检测肉制品中的K值。利用流动相中ATP分解的关联产物(ATP、ADP、AMP、IMP、HxR和Hx)在固定相中的流速不同,将这六种化学组分分离,分别测得这些组分的含量,根据公式1计算出被测样品的K值。
用于K值检测的样品前处理过程如下:将被测样品剁碎成肉泥,从中取(2.00±0.05)g放入50mL离心管内,加入冷却后的10%的高氯酸溶液20mL,涡旋振荡1min,以8000r/min速度离心10min,取出上清液。再用5%的高氯酸溶液20mL重提沉淀物中的待测物,以8000r/min速度离心10min,合并上清液。用10mol/L的NaOH溶液调提取液pH值近6.0,然后再用1.0mol/L的NaOH溶液继续调节pH至6.0~6.4,再用超纯水定容至50mL。用0.45μm的微孔滤膜过滤,滤液于4℃下保存,待测。
HPLC条件如下:Finnigan Surveyor液相色谱仪(赛默飞公司,美国),AQ-C18色谱柱(赛默飞公司,美国),流动相为0.05mol/L的K3PO4缓冲液(pH=6.5),缓冲液用超纯水配制,样品的进样量1μL,流速200μL/min,检测波长254nm。ATP分解的关联产物由外标法定量,测定范围在0~0.5mmol/L。
试验中使用的试剂详情如下:ATP关联物(ATP、ADP、AMP、IMP、HxR和Hx)共6种标准品(纯度≥99%,Sigma-Aldrich公司,美国);磷酸钾、氢氧化钠、高氯酸(分析纯,国药集团化学试剂有限公司,中国);试验用水为Millipore Academic制备的超纯水。
2、结果与分析
2.1 K值分析
采用HPLC法获得了80个样本的K值,并做了统计分析,结果如图2-1所示。不同试验批次的肉样,存储时长一样,K值也会因为个体差异而不同。通过样本的平均值可以看出,随着储存天数的增加,新鲜度不断降低,样本的K值在逐步增加,但增加量不是固定的。其中,5d~6d、6d~7d的增加量相对较大,说明在上述存储周期内,肉样的品质变化较大;感官评价也证实肉样在6d~7d存储周期内,触摸较黏,有明显的酸味,因此可推测肉样在此周期内新鲜度显著下降。本试验所有样本的K值覆盖了猪肉的不同新鲜度,覆盖范围广,使得THz光谱预测K值的数学模型有较好的鲁棒性。
80个样本被随机分为54个校正集和26个预测集,个数比大致为2:1。其中校正集用于建立THz光谱预测K值的数学模型;预测集用来检验所建立的模型预测未知样本K值的准确性。通过表1可以看出,校正集、预测集和样本总集合的K值范围基本相同,平均值和标准差也没有明显区别,因此校正集和预测集的样本分割是合适的。
表1校正集与预测集的K值统计信息
2.2光谱预处理
光谱质量评价方法:肉样的同一表面在相同的测试条件下连续测量6次,获得6条THz光谱,理论上这6条光谱应该完全重合,但由于仪器的噪声及测试误差的影响,连续重复测得的6条光谱不可能完全重合,为了评价光谱的质量,可以计算同一样品表面连续多次重复测试的ns条光谱的标准方差光谱(Standard Variance Spectrum of Repeat Spectral,SVSRS),SVSRS越小,说明光谱质量越好。
式中xij——样本第i次测量在波点j处的ATR反射率,——波点j处ns次测量ATR反射率的均值。
图2-2是某个肉样表面在0.1THz~4THz的6次THz光谱,图2-3是该光谱对应的SVSRS,从图中可以看出在2THz~4THz的SVSRS值明显增高,重复性差。故选择0.1THz~2THz作为建模的光谱频段。
图3-1是80个样本在0.1THz~2THz区域的THz光谱谱线,可以看出,不同猪肉样本的原始光谱强度有很大的差异。光谱的差异不仅包含了样本成分的差异,还包括测量误差,基线漂移和背景噪声。为了消除干扰信息,除了尽可能保持试验环境因素一致外,还须对光谱数据进行预处理,以减弱或去除各种干扰因素。
本发明采用一阶导数(First Order Derivative,FD)预处理光谱数据,一阶导数能够减少基线偏移、漂移和背景干扰造成的数据偏差,使得与新鲜度密切相关的光谱特性变得更为显著。
本发明使用的一阶导数FD预处理光谱数据:式中,x是样本在波点数为i处的ATR反射率;当i=1时,其一阶微分值为当i=m时,其一阶微分值为
由于导数计算会增加噪声,故导数预处理之后采用Savitzky–Golay(SG)多项式平滑光谱。在求导过程中,差分宽度选择十分重要:如果差分宽度太小,噪声会很大,影响所建模型的质量;如果差分宽度太大,平滑过度,会失去大量的细节信息。SG多项式平滑选择奇数个数据序列中相邻的数据点,由这些数据点构成一个窗口,对窗口的中心点进行平滑。平滑中,对窗口中的数据点拟合一多项式,并根据所得多项式对平滑的点进行计算。多项式的拟合运用最小二乘方法。根据计算可以得到平滑后的数据点表达式为:
式中,窗口的宽度为2d+1;s为常数,其数值与窗口宽度有关;λj为SG平滑系数序列。
图3-2为经过15点一阶求导和SG平滑后得到的一阶导数光谱图。
2.3猪肉K值预测模型
由猪肉腐败过程中会使K值相关的ATP关联产物的含量发生变化,而这些生物分子对THz波具有灵敏的光谱响应,THz光谱能够反映出这些生物分子含量的变化。因此THz光谱数据和猪肉的新鲜度之间存在一种间接的关联性。本方法使用主成分回归(PrincipalComponents Regression,PCR)、非线性算法-误差反向传播神经网络回归(BackPropagation Artificial Neural Network,BP-ANN)以及BP-ANN改进模型分别验证这种关联性。
检测模型评价方法:
评价模型质量的指标是采用校正集相关系数(RC)、校正集均方根误差(Root MeanSquared Error of Calibration Set,RMSEC)、预测集相关系数(RP)和预测集均方根误差(Root Mean Squared Error of Prediction Set,RMSEP)。这些参数定义如下:
式中——样本集(包括校正集和预测集)中第i个样品的预测值;
yi——样本集(包括校正集和预测集)中第i个样品的实测值;
nC——校正集的样品数;
nP——预测集的样品数;
ym——校正集或者预测集样品的平均值。
相关系数RC和RP越大,和/或RMSEC和RMSEP越小,则模型的预测能力越好。
本例使用Matlab R2009b(Mathworks公司,美国)软件对光谱数据进行计算与建模。
2.3.1主成分回归PCR预测模型
可以用矩阵形式表示校正集样本的THz光谱数据:
式中,n为校正集样品数,m为光谱波点数,x是样本的ATR反射率;Xn×m是指校正集中的光谱数据。
本试验中的每一条光谱都含有250个波点,光谱的波点数远大于样本数,如果直接用于回归分析,会出现过拟合,降低模型的预测精度和稳定性。同时光谱波点的数据间存在较高的共线性和相关性,也会使得回归模型的结果产生失真。可以通过主成分分析法(Principal Component Analysis,PCA)对光谱信息进行压缩,通过少数几个主成分的得分来近似反映原光谱数据,消除光谱数据点的信息冗余和相关性。
PCA算法是一种常用并有效的信息压缩方法,它从多个样本构成的变量协方差矩阵出发,采用特征分解的方法(即坐标系的线性变换)获取方差最大的主成分来代替原有变量,得到了新变量——主成分得分。主成分之间相互独立、互不相关,可消除原始数据中存在的相关性和信息冗余。因此,PCA在多变量统计分析和光谱信息压缩、提取等领域得到了广泛的应用。
运用主成分分析,原变量矩阵X可以分解为两个矩阵U和P,表示为Un×a=Xn×mPm×a;
式中,式中,矩阵U是得分矩阵(score matrix),表示数据xij(i=1,2,…,n;j=1,2,…,m)在新的坐标体系中(主成分坐标体系)的矢量位置(即坐标值);矩阵P是载荷矩阵(loading matrix),其列向量表示新的坐标系与原坐标系的线性变换系数;U的维数a小于X的维数m;因此,高维的光谱数据空间被降为低维的线性无关的主成分特征空间。取矩阵U的各行数据Ii(i=1,2,…,a)作为预测模型的输入;
PCR预测模型:对矩阵U进行多元线性回归,得到多元线性方程:Y=UB+E,即为PCR预测模型,用来预测K值;式中,Y即为样本集的实测K值,E是服从正态分布的随机误差变量矩阵;
所述参数B的获得方法为:在PCR预测模型的建模过程中,把多个样本随机分为多个校正集和多个预测集;校正集的光谱数据用于建立预测模型;预测集的光谱数据用来检验预测模型的准确性;将校正集样品的实测K值组成矩阵Y,得到方程的解:B=(U′U)-1U′Y,式中,U′为U的转置矩阵。得到参数矩阵B后就可以用预测集样本的THz光谱数据代入上述多元线性方程求出预测集中样本的预测K值。
综上所述,PCR可以分为两步:1测定主成分数,即用主成分分析法将光谱矩阵X降维;2对于降维的X矩阵再进行线性回归分析。
本发明用PCA法将预处理后的光谱矩阵进行主成分分解,取累积贡献率达到了95%的主成分集合作为预测模型的输入。光谱预处理的差分宽度根据预测模型达到最高相关系数RP和最低RMSEP时选择。模型计算表明当一阶差分宽度为15时,累积贡献率95%的主成分集合数为26,PCR的预测性能最佳(Rp=0.63,RMSEP=16.78%),如图4-1所示。图4-2是PCR模型在此参数条件下的K值预测散点图。
2.3.2误差反向传播神经网络回归BP-ANN预测模型
BP-ANN是一个能揭示输入与输出信号间复杂联系的有力分析工具。BP-ANN是一种多层前馈神经网络,这个网络可以被理解为一个非线性函数,网络输入和预测值分别为该函数的自变量和因变量。BP-ANN表达了从自变量到因变量的函数映射关系。本发明所用的BP-ANN的拓扑结构如图5-1所示。
BP-ANN的拓扑结构由三层网络组成,分别是输入层、隐含层和输出层,每层包括多个神经元,相邻层的神经元之间是带权值的单向连接;
Ii是输入层的输入值,i=1,2,…,a;Hj是隐含层的输出值,j=1,2,…,b;输出层是一个节点的值为BP-ANN的预测值,即鲜肉的预测K值;hwij为输入层的神经元与隐含层的神经元之间的连接权值,owj为隐含层的神经元与输出层的神经元之间的连接权值;
输出层是一个节点,是BP-ANN的预测值即预测K值;wij和wjk为BP-ANN的神经元连接权值。
为了降低神经网络的复杂度,采用上述PCA方法将预处理后的光谱矩阵进行主成分分解,取累积贡献率达到95%的主成分集合作为神经网络的输入,单隐含层的节点数由经验公式得出:
式中:隐含层的节点数式中:a为输入层节点数,c为1~10范围内的常数,1为输出层节点数。据此隐含层的节点数范围选择为4~17。
BP神经网络预测前首先要训练网络,通过训练使网络具有联想记忆和预测能力。BP-ANN的训练过程包括以下几个步骤:
1)网络初始化:根据输入维数和输出维数确定a,b;初始化hwij、owj、隐含层阈值thaj、输出层阈值thb,权值和阈值是范围在-1~1的随机数;给定学习速率η,η=0.01;
2)隐含层输出计算:隐含层的输出式中,函数f(x)为隐含层激励函数,该函数的表达式为:
3)输出层输出计算:BP-ANN的预测输出
4)误差计算:BP-ANN的预测误差式中,y是采用HPLC方法实测的K值;
5)权值更新:hwij=hwij+ηHj(1-Hj)Iiowje,i=1,2,…,a;j=1,2,…,b;owj=owj+ηHje,j=1,2,…,b;
6)阈值更新:thaj=thaj+ηHj(1-Hj)owje,j=1,2,…,b;thb=thb+e;
7)根据迭代次数和最终迭代误差判断算法迭代是否结束,若没有结束,返回步骤2)。
BP-ANN的主要特点是信号前向传播,误差反向传播。在前向传递中,输入信号从输入层经隐含层逐层处理,直至输出层。每一层的神经元状态只影响下一层神经元状态。如果输出层得不到期望输出,则转入反向传播,根据预测误差调整网络权值和阈值,从而使BP神经网络预测输出不断逼近期望输出。当训练结束后,就可以用训练好后的网络预测K值。
可见,基于BP-ANN的K值预测建模包括BP-ANN的构建,训练和预测三步。该算法流程用图5-2表示。
训练神经网络前,输入的光谱矩阵被归一化至-1~1的范围内,实测K值被归一化至0~1的范围内。因为隐含层的节点数会影响神经网络预测的性能,所以隐含层的节点数采用留一交叉验证法选取,即选取RMSECV值最小时的节点数。根据这一原则,考察预测模型在预处理差分宽度3~47范围内,隐含层的节点数在4~17的范围内,RMSECV的数值变化情况,如图5-3所示。可以看出,预处理差分宽度为13且隐含层节点数是9时,RMSECV数值最小为18.10%,BP-ANN模型的预测性能最佳。图5-4是BP-ANN模型在此参数条件下的K值预测散点图。
2.3.3 BP-ANN改进模型
本改进算法的核心思想是针对同一个校正集训练不同的预测器(弱预测器),然后把这些弱预测器集合起来,构成一个更强的最终预测器(强预测器)。该算法的特点是弱预测器的性能差,但强预测器的性能却很优。其原因在于它能够合理的划分训练集合,以及合理的合并弱预测器以形成强预测器。其合理之处具体体现在以下两方面:使用加权后选取的训练数据而非随机选取的训练样本,这样将训练的焦点集中在比较难预测的训练数据样本上;使用加权的投票机制将弱预测器联合起来,让预测效果好的弱预测器具有较大的权重,而预测效果差的预测器具有较小的权重。本改进模型把BP-ANN作为弱预测器,反复训练BP-ANN预测样本输出,通过改进算法将所得的多个BP-ANN弱预测器组成强预测器。
具体改进算法如下:
1.初始化:n为校正集的样本数,初始化校正集中训练数据的分布权重为Dt(j)=1/n(j=1,2,…,n),确定弱预测器预测误差的阈值Φ,根据样本的输入输出维数确定BP-ANN弱预测器结构,初始化网络参数;。
2.训练弱预测器:训练弱预测器:训练第t个弱预测器时,用训练数据训练弱预测器,得到弱预测器输出的预测K值
然后计算预测误差(t=1,2,…,T),T是弱预测器的个数;
3.计算弱预测器的权重wt:
4.测试数据权重调整,
式中,Bt是归一化因子
5.将2,3,4步骤循环T次后,得到T个弱预测器,预测模型为ft。按更新的权重叠加,得到强预测器的预测模型
改进算法流程如图6-1所示,可见它是一种整合算法,通过上述加权策略整合集合内各弱预测器的预测能力而获得总体预测性能的提高。本发明采用BP-ANN改进算法,以前面建立的BP-ANN模型参数为基础,使用改进算法提升其预测性能,构建K值的BP-ANN改进预测模型。
预测误差的阈值Φ对BP-ANN改进模型的性能有显著的影响,采用留一交叉验证法选取RMSECV值最小时的Φ:首先,以较宽的步长0.01在较大的范围选择Φ为0.05~0.25,RMSECV值的情况如图6-2所示。可以看出,在0.13~0.14的范围内,模型的性能比较好。接着,在此范围内,以较小的0.001步长考察0.13~0.14,可以看出图6-3中,Φ取0.136时,RMSECV值最小,BP-ANN改进模型能够获得最优的预测性能。将此参数代入BP-ANN改进算法中迭代,获得了10个弱BP-ANN预测器,这些预测器的性能如表2所示。可以看出:弱预测器的性能有差异,其中弱预测器2和8的RMSEC较小,预测性能较好,其预测误差和εt较小,迭代所生成的权重wt较大,代表着在整合后的强预测器中这两个弱预测器有较大比重;相反,弱预测器6的RMSEC较大,预测性能最差,其预测误差和εt最大,迭代所生成的权重wt最小,代表着在整合强预测器的过程中这个弱预测器贡献很小;上述10个弱预测器的预测性能都不理想,但是当用权重wt加权整合弱预测器后,所获得的强预测器却有较好的性能,其预测性能优于各弱预测器。通过这个强预测器获得BP-ANN改进模型的K值预测散点图,如图6-4所示。
表2 BP-ANN改进模型的预测器性能
2.4THz光谱预测模型的比较
上述三种预测模型采用预测集数据验证模型的K值预测准确度,方法为:对于预测集数据,取经过一阶微分预处理后的预测集样本光谱数据:
式中,n′为预测集样本数,m为光谱波点数,x是预测集样本的ATR反射率;
使用校正集PCA算法中的线性变换系数矩阵P对预测集光谱信息进行压缩:表示为Un′×a=Xn′×mPm×a,取矩阵U的各行数据Ii(i=1,2,…,a)作为已建立好的预测模型的输入,经过预测模型的计算得到了模型输出,即预测K值。通过公式(5)和公式(6)的计算,能够得到模型的预测能力,作为评价模型性能的指标。
表3系统的将BP-ANN改进模型和传统的BP-ANN以及主成分回归(PrincipalComponents Regression,PCR)模型在THz光谱预测K值的性能方面进行比较。,可以看出光谱数据预处理的差分宽度选择13(BP-ANN、BP-ANN改进模型)或者15(PCR模型)是合适的,差分宽度过小或者过大都会降低模型的预测性能。还可以看出非线性模型(BP-ANN、BP-ANN改进模型)的预测性能明显优于线性模型(PCR模型)。而且,BP-ANN改进模型比BP-ANN的K值预测性能有了提高。上述结果可以通过以下几个方面来解释:
表3三种K值预测模型的回归结果比较
1、从THz光谱和猪肉K值的非线性趋势上看,K值由ATP的6种关联物含量的比值决定,这些分子物质的含量与THz光谱中的谱线数据是非线性关系。因此非线性模型的拟合效果会好于线性模型。
2、从猪肉变质的化学机制上看,猪肉的变质是一个复杂的化学过程,在若干种致腐细菌的作用下,肌肉中的蛋白质先水解为多肽,再水解成氨基酸,并进一步分解为各种有机物质。现有技术的研究表明,蛋白质、多肽和氨基酸等生物分子在THz波段都具有各自的特征吸收,其特征吸收主要来自于分子的集体振动模,所以THz光谱能够反映这些变化。但是猪肉中的生物分子种类繁多,在常温下各特征谱具有重叠性,导致THz光谱并不是仅仅表达了K值的变化信息,而是猪肉的化学成分复杂变化的综合信息。因此,K值和THz光谱的关系应该是复杂非线性关系,而线性模型不能够解释这种复杂的回归关系。
3、从建模算法的原理结构上看,非线性模型比线性模型更善于自学习和自调整,BP-ANN的网络拓扑结构更适合分析复杂的化学成分。当遇到复杂的回归关系时,所建预测模型会更优秀。BP-ANN改进算法通过在迭代过程中合理整合弱预测器,使BP-ANN弱预测模型逐渐提升为强预测模型。因此,BP-ANN改进模型比BP-ANN模型的预测性能有了提高。
2.5模型的实际意义
表3中的RP与RMSEP指标表示模型对未知样本K值预测的准确性。未知样本,即未知其K值的样本,不同于校正集和预测集的样本,其K值是通过理化分析HPLC方法获得的。通过一阶微分预处理以及PCA光谱信息压缩方法,将处理后的未知样本的THz光谱数据代入模型,能够快速计算出未知样本的K值。本方案把校正集的样本用于建模,预测集的样本用于判断模型优劣,未知样本的K值预测就是模型的实用化。模型的实际意义就是通过THz光谱快速检测未知样本的K值,而不是仅仅用已知样本(包括校正集和预测集)建模与训练。
3、结论
本发明研究结果表明,采用ATR全反射模式,在0.1THz~2THz范围内获取冷鲜猪瘦肉表面的THz光谱数据,经一阶微分和SG平滑滤波处理后构建的数学模型,能快速无损检测猪肉K值,以评价猪肉新鲜度。通过对三种预测模型PCR、BP-ANN、BP-ANN改进模型的比较研究表明,非线性BP-ANN和BP-ANN改进模型比线性PCR模型能够更好地拟合THz光谱数据和新鲜度K值之间的复杂非线性关系。而BP-ANN改进模型在处理复杂关系模型上具有一定的优势,将BP-ANN的预测性能提升到了RP为0.78,RMSEP为13.45%。
基于相同的THz检测原理,THz光谱分析法还能够无损检测其它肉类(如鸡肉、牛肉、鱼肉等)的K值。本发明为进一步基于此方法开发设计便携式快速无损检测设备提供了理论基础。
Claims (4)
1.一种基于THz光谱分析的鲜肉K值快速无损检测模型,其特征是本模型的建模步骤包括:步骤1)构建多层反向传播神经网络Back Propagation ArtificialNeural Network,BP-ANN;步骤2)训练;
所述步骤1)中:
1.1)采用THz衰减全反射Attenuated Total Reflectance,ATR检测模式对鲜肉样本的THz光谱进行取样;对鲜肉样本的THz光谱进行取样得到样本光谱数据进行处理;
用于建模的所有样本被随机分为校正集和预测集;校正集的光谱数据用于建立预测模型;预测集的光谱数据用来检验预测模型的准确性;
样本光谱数据矩阵为式中,n为校正集样本数,m为光谱波点数,x是样本的ATR反射率;Xn×m是指校正集中的光谱数据;
先对光谱信息进行压缩:把矩阵Xn×m分解为两个矩阵U和P,表示为Un×a=Xn×mPm×a;式中,矩阵U表示数据xij(i=1,2,…,n;j=1,2,…,m)在新的坐标体系中的矢量位置;矩阵P的列向量表示新的坐标系与原坐标系的线性变换系数;U的维数a小于X的维数m;取矩阵U的各行数据Ii(i=1,2,…,a)作为步骤1.2)的预测模型的输入;
1.2)把多层反向传播神经网络BP-ANN视为非线性函数,BP-ANN输入和预测值分别为该非线性函数的自变量和因变量,BP-ANN表达了从自变量到因变量的函数映射关系;
BP-ANN的拓扑结构由三层网络组成,分别是输入层、隐含层和输出层,每层包括多个神经元,相邻层的神经元之间是带权值的单向连接;
Ii是输入层的输入值,i=1,2,…,a;Hj是隐含层的输出值,j=1,2,…,b;输出层是一个节点 的值为BP-ANN的预测值,即鲜肉的预测K值;hwij为输入层的神经元与隐含层的神经元之间的连接权值,owj为隐含层的神经元与输出层的神经元之间的连接权值;
隐含层的节点数式中:a为输入层节点数,c为1~10范围内的常数;
所述步骤2)中,BP-ANN的训练步骤包括:
2.1)网络初始化:根据输入维数和输出维数确定a,b;初始化hwij、owj、隐含层阈值thaj、输出层阈值thb,权值和阈值是范围在-1~1的随机数;给定学习速率η,η=0.01;
2.2)隐含层输出计算:隐含层的输出式中,函数f(x)为隐含层激励函数,该函数的表达式为:
2.3)输出层输出计算:BP-ANN的预测输出
2.4)误差计算:BP-ANN的预测误差式中,y是采用高效液相色谱HPLC方法实测的K值;
2.5)权值更新:hwij=hwij+ηHj(1-Hj)Iiowje,i=1,2,…,a;j=1,2,…,b;
owj=owj+ηHje,j=1,2,…,b;
2.6)阈值更新:thaj=thaj+ηHj(1-Hj)owje,j=1,2,…,b;
thb=thb+e;
2.7)根据迭代次数和最终迭代误差判断算法迭代是否结束,若没有结束,返回步骤2.2)。
2.根据权利要求1所述的基于THz光谱分析的鲜肉K值快速无损检测模型,其特征是所述步骤1.1)中,光谱频段为0.1THz~2THz。
3.根据权利要求1所述的基于THz光谱分析的鲜肉K值快速无损检测模型,其特征是步骤1)中,先对样本光谱数据进行预处理,预处理得到的数据作为矩阵X的数据;样本光谱数据进行预处理的方法为:
先采用一阶导数预处理光谱数据:式中,x是样本在波点数为i处的ATR反射率;当i=1时,其一阶微分值为……;当i=m时,其一阶微分值为
再采用SG多项式平滑光谱:选择奇数个光谱数据序列中相邻的数据点,由这些数据点构成一个窗口,对窗口的中心点进行平滑;平滑过程中,对窗口中的数据点拟合一个多项式,并根据所得该多项式对平滑的点进行计算;得到平滑后的数据点表达式为:式中,窗口的宽度为2d+1,s为常数,λj为SG平滑系数序列;
该多项式的拟合运用最小二乘方法。
4.根据权利要求1所述的基于THz光谱分析的鲜肉K值快速无损检测模型,其特征是模型的预测建模步骤还包括步骤3)模型改进与优化,把BP-ANN预测模型作为弱预测器进行优化,得到强预测器,步骤包括:
3.1)初始化:n为校正集的样本数,初始化校正集中训练数据的分布权重为Dt(j)=1/n(j=1,2,…,n),确定弱预测器预测误差的阈值Φ,根据样本的输入输出维数确定BP-ANN弱预测器结构,初始化网络参数;
3.2)训练弱预测器:训练第t个弱预测器时,用训练数据训练弱预测器,得到弱预测器输出的预测K值
然后计算预测误差(t=1,2,…,T),T是弱预测器的个数;
3.3)计算弱预测器的权重
3.4)调整训练数据分布权重并归一化:式中,
3.5)将3.2~3.4)步骤循环T次后,得到T个弱预测器,预测模型为ft。按更新的权重叠加,得到强预测器的预测模型
所述Φ值是采用留一交叉验证法选取模型的性能最好时的Φ值,即在一定范围内,以固定的步长,考察Φ取不同的值时,建模步骤在留一交叉验证法下的RMSECV的值,取RMSECV的值为最小时的Φ作为最优阈值;
留一交叉验证法的运算过程是:在校正集的n个样本中,每个样本都单独作为预测集,其余n-1个样本作为校正集;以校正集为依据,通过建模步骤得到这个预测集样本的预测值;经过n次循环,得到所有样本的预测值;
获得留一交叉验证法的性能指标RMSECV,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710167175.5A CN107014769B (zh) | 2017-03-20 | 2017-03-20 | 一种基于THz光谱分析的鲜肉K值快速无损检测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710167175.5A CN107014769B (zh) | 2017-03-20 | 2017-03-20 | 一种基于THz光谱分析的鲜肉K值快速无损检测模型 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107014769A true CN107014769A (zh) | 2017-08-04 |
CN107014769B CN107014769B (zh) | 2019-03-29 |
Family
ID=59440036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710167175.5A Expired - Fee Related CN107014769B (zh) | 2017-03-20 | 2017-03-20 | 一种基于THz光谱分析的鲜肉K值快速无损检测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107014769B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108037520A (zh) * | 2017-12-27 | 2018-05-15 | 中国人民解放军战略支援部队信息工程大学 | 阵列幅相误差条件下基于神经网络的直接定位偏差修正方法 |
CN109086254A (zh) * | 2017-12-29 | 2018-12-25 | 东北电力大学 | 基于高光谱技术石蜡内部组分综合等级评定 |
WO2019040002A1 (en) * | 2017-08-25 | 2019-02-28 | National University Of Singapore | ADVANCED THZ SYSTEM AND METHOD |
CN109992861A (zh) * | 2019-03-21 | 2019-07-09 | 温州大学 | 一种近红外光谱建模方法 |
CN110068543A (zh) * | 2019-03-26 | 2019-07-30 | 昆明理工大学 | 一种基于迁移学习的太赫兹光谱识别方法 |
CN110108647A (zh) * | 2019-04-30 | 2019-08-09 | 深圳市太赫兹科技创新研究院有限公司 | 一种肉类品种的鉴别方法和鉴别系统 |
CN112289393A (zh) * | 2020-10-28 | 2021-01-29 | 广西贺州市桂东电子科技有限责任公司 | 一种基于神经网络集成学习的阳极铝箔性能预测系统 |
CN112419112A (zh) * | 2020-11-30 | 2021-02-26 | 郑兰 | 学业成长曲线生成方法、装置、电子设备和存储介质 |
CN113588571A (zh) * | 2021-09-29 | 2021-11-02 | 广东省农业科学院动物科学研究所 | 一种基于高光谱成像的水产品的腥味识别方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104007243A (zh) * | 2014-01-13 | 2014-08-27 | 上海市长宁区卫生局卫生监督所 | 应用反向传播神经网络模型评价游泳池水质的方法 |
CN104330382A (zh) * | 2014-11-17 | 2015-02-04 | 中国农业科学院北京畜牧兽医研究所 | 一种生鲜牛肉的安全分级方法 |
CN104655761A (zh) * | 2015-02-28 | 2015-05-27 | 华南理工大学 | 一种基于多光谱成像在线测定鱼肉新鲜度指标k值的方法 |
-
2017
- 2017-03-20 CN CN201710167175.5A patent/CN107014769B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104007243A (zh) * | 2014-01-13 | 2014-08-27 | 上海市长宁区卫生局卫生监督所 | 应用反向传播神经网络模型评价游泳池水质的方法 |
CN104330382A (zh) * | 2014-11-17 | 2015-02-04 | 中国农业科学院北京畜牧兽医研究所 | 一种生鲜牛肉的安全分级方法 |
CN104655761A (zh) * | 2015-02-28 | 2015-05-27 | 华南理工大学 | 一种基于多光谱成像在线测定鱼肉新鲜度指标k值的方法 |
Non-Patent Citations (3)
Title |
---|
张应龙 等: "肉品新鲜度快速检测技术研究进展", 《第219-224页》 * |
王福安 等: "《分子热力学与色谱保留》", 28 February 2001, 气象出版社 * |
齐亮 等: "冷鲜猪肉的新鲜度无损检测技术现状及THz检测技术展望", 《食品与机械》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019040002A1 (en) * | 2017-08-25 | 2019-02-28 | National University Of Singapore | ADVANCED THZ SYSTEM AND METHOD |
CN108037520A (zh) * | 2017-12-27 | 2018-05-15 | 中国人民解放军战略支援部队信息工程大学 | 阵列幅相误差条件下基于神经网络的直接定位偏差修正方法 |
CN109086254A (zh) * | 2017-12-29 | 2018-12-25 | 东北电力大学 | 基于高光谱技术石蜡内部组分综合等级评定 |
CN109992861B (zh) * | 2019-03-21 | 2022-12-27 | 温州大学 | 一种近红外光谱建模方法 |
CN109992861A (zh) * | 2019-03-21 | 2019-07-09 | 温州大学 | 一种近红外光谱建模方法 |
CN110068543A (zh) * | 2019-03-26 | 2019-07-30 | 昆明理工大学 | 一种基于迁移学习的太赫兹光谱识别方法 |
CN110108647A (zh) * | 2019-04-30 | 2019-08-09 | 深圳市太赫兹科技创新研究院有限公司 | 一种肉类品种的鉴别方法和鉴别系统 |
CN112289393A (zh) * | 2020-10-28 | 2021-01-29 | 广西贺州市桂东电子科技有限责任公司 | 一种基于神经网络集成学习的阳极铝箔性能预测系统 |
CN112289393B (zh) * | 2020-10-28 | 2023-08-22 | 广西贺州市桂东电子科技有限责任公司 | 一种基于神经网络集成学习的阳极铝箔性能预测系统 |
CN112419112A (zh) * | 2020-11-30 | 2021-02-26 | 郑兰 | 学业成长曲线生成方法、装置、电子设备和存储介质 |
CN112419112B (zh) * | 2020-11-30 | 2024-03-05 | 郑兰 | 学业成长曲线生成方法、装置、电子设备和存储介质 |
CN113588571A (zh) * | 2021-09-29 | 2021-11-02 | 广东省农业科学院动物科学研究所 | 一种基于高光谱成像的水产品的腥味识别方法及系统 |
CN113588571B (zh) * | 2021-09-29 | 2021-12-03 | 广东省农业科学院动物科学研究所 | 一种基于高光谱成像的水产品的腥味识别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107014769B (zh) | 2019-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107014769B (zh) | 一种基于THz光谱分析的鲜肉K值快速无损检测模型 | |
Tian et al. | Early detection of freezing damage in oranges by online Vis/NIR transmission coupled with diameter correction method and deep 1D-CNN | |
CN101430276B (zh) | 光谱分析中波长变量优选的方法 | |
Zhu et al. | Determining sugar content and firmness of ‘Fuji’apples by using portable near‐infrared spectrometer and diffuse transmittance spectroscopy | |
CN101413885A (zh) | 一种快速定量蜂蜜品质的近红外光谱方法 | |
Chen et al. | Comparison between back propagation neural network and regression models for the estimation of pigment content in rice leaves and panicles using hyperspectral data | |
Wang et al. | Vis/NIR optical biosensors applications for fruit monitoring | |
Yu et al. | Nondestructive determination of SSC in Korla fragrant pear using a portable near-infrared spectroscopy system | |
Che et al. | Application of visible/near‐infrared spectroscopy in the prediction of azodicarbonamide in wheat flour | |
CN105445217A (zh) | 基于衰减全反射傅里叶变换红外光谱技术的糙米中黄曲霉毒素含量的快速检测方法 | |
Li et al. | Nondestructive detection of frying times for soybean oil by NIR-spectroscopy technology with Adaboost-SVM (RBF) | |
Malvandi et al. | Non-destructive measurement and real-time monitoring of apple hardness during ultrasonic contact drying via portable NIR spectroscopy and machine learning | |
CN106960091A (zh) | 一种鲜肉新鲜度K值的THz光谱快速无损检测方法 | |
Mishra et al. | Improved prediction of minced pork meat chemical properties with near-infrared spectroscopy by a fusion of scatter-correction techniques | |
CN105158201A (zh) | 一种基于ft-nir技术的糙米中黄曲霉毒素含量的快速检测方法 | |
Chen et al. | A novel variable selection method based on stability and variable permutation for multivariate calibration | |
Wang et al. | NIR based wireless sensing approach for fruit monitoring | |
CN107024445A (zh) | 蔬菜中硝酸盐的快速检测的建模方法和检测方法 | |
Kim et al. | Neural network based prediction of soluble solids concentrationin oriental melon using VIS/NIR spectroscopy | |
Wei et al. | Generalisation of tea moisture content models based on VNIR spectra subjected to fractional differential treatment | |
Jiang et al. | Comparison of wavelength selected methods for improving of prediction performance of PLS model to determine aflatoxin B1 (AFB1) in wheat samples during storage | |
Jiang et al. | Moving-window-improved Monte Carlo uninformative variable elimination combining successive projections algorithm for near-infrared spectroscopy (NIRS) | |
Tian et al. | Improving the prediction performance of soluble solids content (SSC) in kiwifruit by means of near-infrared spectroscopy using slope/bias correction and calibration updating | |
CN103134770A (zh) | 消除水分对近红外光谱检测土壤全氮含量影响的方法 | |
Kemps et al. | The importance of choosing the right validation strategy in inverse modelling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190329 |
|
CF01 | Termination of patent right due to non-payment of annual fee |