WO2023108514A1

WO2023108514A1 - 茶叶近红外光谱分析中谱峰自动检测与重构方法及系统

Info

Publication number: WO2023108514A1
Application number: PCT/CN2021/138605
Authority: WO
Inventors: 潘天红; 吴超; 陈琦; 陈山; 樊渊
Original assignee: 安徽大学
Priority date: 2021-12-14
Filing date: 2021-12-16
Publication date: 2023-06-22
Also published as: US20230243744A1; CN114216877B; CN114216877A

Abstract

一种茶叶近红外光谱分析中谱峰自动检测与重构方法及系统，该方法包括：先采集原始光谱数据，再初始化参数，接着计算吸收峰的位置和宽度，随后更新相关系数并筛选稀疏块，然后计算代价函数及期望，之后判定终止条件，最后输出重构数据。采用自动检测谱峰位置和确定峰宽的块稀疏贝叶斯学习方法能够准确地判断近红外光谱的谱峰数量和位置，从而能够准确地重构选取出谱峰特征，避免了算法重构过程出现误重构、有丢失的问题，且基于稀疏重构和谱峰自动检测的策略能够实现多重叠峰近红外光谱数据的吸收峰特征选取，进而实现高精度绿茶近红外光谱数据吸收峰自动检测与重构，有利于扩大茶叶检测等级精度及市场贸易。

Description

茶叶近红外光谱分析中谱峰自动检测与重构方法及系统

技术领域

本发明涉及光谱分析技术领域，尤其涉及茶叶近红外光谱分析中谱峰自动检测与重构方法及系统。

背景技术

茶叶目前是我国最重要的饮品之一，茶叶品质等级划分与其内含的茶多酚、咖啡碱、氨基酸、糖分等多种指标相关，长期以来，人们对于茶叶加工中各个工序质量的掌握主要依赖感官审评，缺乏量化的加工评价标准，对于加工后产品质量的判别主要是采用感官审评的方法，缺乏一种对主要化学成分和外部形态特点兼顾的、数字化快速评价方法，随着我国进出口贸易的不断开展及人民物质需求的不断提高，对于产业等级划分和品质鉴别提出更加精细的分析要求，现有的基于经验的鉴别方法已经不适用大规模、高精度的分析要求。

近红外光谱技术作为光谱学的一个重要分支，具有检测过程无污染、成本低、检测周期短等特点，已在茶叶相关产业分析中得到广泛应用，但在实际分析过程中，由于光谱数据的高维性、共线性和谱峰数量的有限性，使获得所采集的全波长范围光谱数据存在大量无关的特征变量，根据比尔-朗伯定律，分析模型的性能取决于建模数据的有效性，无关变量的存在将破坏数据特征，因此在定量分析之前需要对光谱数据进行必要的特征选择操作。

目前应用较广的稀疏重构方法主要有Group Lasso、Block Orth ogonal Matching Pursuit、稀疏贝叶斯学习和块稀疏贝叶斯学习方法，其中应用最具前景的是基于块稀疏贝叶斯学习的稀疏重构方法，该方法虽然能够有效避免求解范数的问题且引入了块结构的方式，但并未考虑在确定和划分块的位置和大小的随机性问题，并且未准确的确定谱峰位置而划分块，容易导致谱峰位置特征变量被稀疏的现象，从而导致重构结果不准确，针对含有多个重叠峰的茶叶近红外光谱数据，如何精准地选取谱峰特征变量对于茶叶定性、定量分析过程至关重，因此，本发明提出茶叶近红外光谱分析中谱峰自动检测与重构方法及系统以解决现有技术中存在的问题。

发明内容

针对上述问题，本发明的目的在于提出茶叶近红外光谱分析中谱峰自动检测与重构方法及系统，该方法采用自动检测谱峰位置和确定峰宽的块稀疏贝叶斯学习方法能够准确的判断近红外光谱的谱峰数量和位置，从而能够准确的重构选取出谱峰特征，避免了算法重构过程出现误重构、有丢失的问题，且基于稀疏重构和谱峰自动检测的策略能够实现多重叠峰近红外光谱数据的吸收峰特征选取。

为了实现本发明的目的，本发明通过以下技术方案实现：茶叶近红外光谱分析中谱峰自动检测与重构方法，包括以下步骤：

步骤一：先采集待检测茶叶样本，再获取茶叶样本的近红外光谱数据，并形成原始数据；

步骤二：先获取原始数据，再初始化包含相关系数γ、迭代次数Τ、噪声方差λ、对称半正定矩阵Α以及相关系数相对误差η的块稀疏贝叶斯学习方法参数；

步骤三：根据原始数据中的光谱特征，基于一阶偏差和二阶偏差来计算光谱中的吸收峰位置；

步骤四：根据计算得到的吸收峰位置，基于半峰高计算谱峰的峰宽；

步骤五：根据每个块的稀疏度控制系数计算块的对称半正定矩阵、相关性结构矩阵和相关系数；

步骤六：基于代价函数计算原始数据中每个块的误差值，并筛选稀疏块；

步骤七：计算光谱后验概率的期望和方差；

步骤八：利用最小化代价函数求解超参数，并更新初始化参数中的噪声方差λ；

步骤九：计算块相关系数的相对误差及当前迭代次数，若相对误差小于设定误差系数η或当前迭代次数大于设定迭代次数Τ，则转至步骤十，否则转至步骤五；

步骤十：利用光谱后验概率的期望，确定最终的茶叶稀疏重构数据并输出。

进一步改进在于：所述步骤二中，块稀疏贝叶斯学习方法优化函数如下：

L＝log|λΙ+ΩΣ ₀Ω ^T|+y ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，I表示单位矩阵，y表示光谱的压缩矩阵，

是测量矩阵，

是所有块的方差矩阵，表示为：

Σ ₀＝diag{γ ₁Β ₁,…,γ _iΒ _i,…,γ _gΒ _g}

其中，γ _i表示第i个块的块相关系数，B _i表示第i个块的结构矩阵。

进一步改进在于：所述步骤三中，谱峰位置确定计算如下：

Δx _j＝x _j-x _j-1

Δ ²x _j＝Δx _j-Δx _j-1

s.t.Δx _j＝0 and Δ ²x _j＜0

其中，Δx _j和Δ ²x _j分别是谱峰顶点x _j的一阶偏差和二阶偏差。

进一步改进在于：所述步骤四中，谱峰宽度的计算表示如下：

其中，n和m分别是x _n和x _m的索引，相对高度差H表示如下：

其中，x _i和x _k分别是谱峰的起始点和终止点。

进一步改进在于：所述步骤五中，对称半正定矩阵、相关性结构矩阵和相关系数表示如下：

其中，

和

d _i是第i个块的大小。

进一步改进在于：所述步骤六中，代价函数误差计算如下：

L＝log|λΙ+ΩΣ ₀Ω ^T|+y ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，

是测量矩阵，

是所有块的方差矩阵，表示为：

其中，

表示第i块在第t步迭代时块的方差矩阵。

进一步改进在于：所述步骤七中，后验概率期望计算如下：

μ _x＝Σ ₀Ω ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，y表示为经过测量矩阵Ω得到光谱的压缩矩阵。

进一步改进在于：所述步骤九中，相对误差判断条件表示如下：

其中，γ ^(t)是第t次迭代的相关系数。

茶叶近红外光谱分析中谱峰自动检测与重构系统，包括：

样本采集模块，用于采集茶叶样本，获取茶叶近红外光谱数据，形成原始数据；

参数初始化模块，用于获取原始数据，并初始化块稀疏贝叶斯学习方法参数，初始化参数包含：相关系数γ、迭代次数Τ、噪声方差λ、对称半正定矩阵Α以及相关系数相对误差η；

谱峰位置计算模块，用于根据光谱数据的一阶、二阶偏差确定吸收峰的位置；

谱峰宽度计算模块，用于根据吸收峰的半峰高确定峰宽；

相关系数计算模块，用于计算每个块的稀疏度控制系数，得到相关系数；

筛选模块，用于根据代价函数计算每个块的误差值，并筛选稀疏块；

期望和方差计算模块，用于根据光谱的后验概率分布，得到期望和方差；

噪声方差更新模块，用于根据最小化代价函数求解超参数，得到噪声方差更新；

判断模块，用于计算块相关系数的相对误差及当前迭代次数，若相对误差小于设定误差系数η或当前迭代次数大于设定迭代次数Τ，则退出判断，否则重新调用计算块相关系数和块筛选模块进行稀疏重构的计算；

数据校正模块，用于利用光谱后验概率的期望，确定最终的茶叶稀疏重构数据并输出。

本发明的有益效果为：本发明采用自动检测谱峰位置和确定峰宽的块稀疏贝叶斯学习方法能够准确的判断近红外光谱的谱峰数量和位置，从而能够准确的重构选取出谱峰特征，避免了算法重构过程出现误重构、有丢失的问题，且基于稀疏重构和谱峰自动检测的策略能够实现多重叠峰近红外光谱数据的吸收峰特征选取，进而实现高精度绿茶近红外光谱数据吸收峰自动检测与重构，有利于扩大茶叶检测等级精度及市场贸易。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一的方法流程示意图；

图2是本发明实施例一的茶叶光谱数据示意图；

图3是本发明实施例一的叶吸收峰确定及重构结果示意图；

图4是本发明实施例一的不同重构方法分析结果对比示意图；

图5是本发明实施例二的系统结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

参见图1、图2、图3、图4，本实施例提供了茶叶近红外光谱分析中谱峰自动检测与重构方法，包括以下步骤：

步骤一：先采集待检测茶叶样本，再获取茶叶样本的近红外光谱数据，并形成原始数据，采集绿茶光谱数据为

糖分含量数据为

步骤二：先获取原始数据，再初始化包含相关系数γ、迭代次数Τ、噪声方差λ、对称半正定矩阵Α以及相关系数相对误差η的块稀疏贝叶斯学习方法参数，初始化参数设置为：迭代次数Τ＝100，噪声方差λ＝10 ^-2，相关系数γ＝0，相对误差η＝10 ^-8及测量矩阵Ω＝rand()；

块稀疏贝叶斯学习方法优化函数如下：

L＝log|λΙ+ΩΣ ₀Ω ^T|+y ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，I表示单位矩阵，y表示光谱的压缩矩阵，

是测量矩阵，

是所有块的方差矩阵，表示为：

Σ ₀＝diag{γ ₁Β ₁,…,γ _iΒ _i,…,γ _gΒ _g}

其中，γ _i表示第i个块的块相关系数，B _i表示第i个块的结构矩阵；

步骤三：根据原始数据中的光谱特征，基于一阶偏差和二阶偏差来计算光谱中的吸收峰位置，谱峰位置确定计算如下：

Δx _j＝x _j-x _j-1

Δ ²x _j＝Δx _j-Δx _j-1

s.t.Δx _j＝0 and Δ ²x _j＜0

其中，Δx _j和Δ ²x _j分别是谱峰顶点x _j的一阶偏差和二阶偏差；

步骤四：根据计算得到的吸收峰位置，基于半峰高计算谱峰的峰宽，谱峰宽度的计算表示如下：

其中，n和m分别是x _n和x _m的索引，相对高度差H表示如下：

其中，x _i和x _k分别是谱峰的起始点和终止点；

步骤五：根据每个块的稀疏度控制系数计算块的对称半正定矩阵、相关性结构矩阵和相关系数，对称半正定矩阵、相关性结构矩阵和相关系数表示如下：

其中，

和

d _i是第i个块的大小；

步骤六：基于代价函数计算原始数据中每个块的误差值，并筛选稀疏块，代价函数误差计算如下：

L＝log|λΙ+ΩΣ ₀Ω ^T|+y ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，

是测量矩阵，

是所有块的方差矩阵，表示为：

其中，

表示第i块在第t步迭代时块的方差矩阵；

步骤七：计算光谱后验概率的期望和方差，后验概率期望计算如下：

μ＝Σ ₀Ω ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，y表示为经过测量矩阵Ω得到光谱的压缩矩阵；

步骤八：利用最小化代价函数求解超参数，并更新初始化参数中的噪声方差λ，计算表示：

步骤九：计算块相关系数的相对误差及当前迭代次数，若相对误差小于设定误差系数η或当前迭代次数大于设定迭代次数Τ，则转至步骤十，否则转至步骤五，，相对误差判断条件表示如下：

其中，γ ^(t)是第t次迭代的相关系数；

基于输出的茶叶稀疏重构数据，对茶叶进行糖分预测，具体为：当采用稀疏贝叶斯学习(SBL)时，光谱后验概率的期望更新公式表示为：

其中，

表示迭代更新系数；

当采用块稀疏贝叶斯学习(Block SBL)时，期望更新公式表示为：

μ _x＝Σ ₀Ω ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，y表示为经过测量矩阵Ω得到光谱的压缩矩阵；

糖分预测定量分析指标为决定系数，具体表示为：

其中，z _i表示真实值，

表示预测值，

为样本均值，n _p表示预测集样本数，本实施例中n _p＝47，对上述方法与常用的稀疏重构方法SBL进行对比可得，本发明提供的方法能够实现高精度绿茶近红外光谱数据吸收峰自动检测与重构。

实施例二

参见图5，本实施例提供了茶叶近红外光谱分析中谱峰自动检测与重构系统，包括：

谱峰宽度计算模块，用于根据吸收峰的半峰高确定峰宽；

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于，包括以下步骤：

步骤一：先采集待检测茶叶样本，再获取茶叶样本的近红外光谱数据，并形成原始数据；

步骤二：先获取原始数据，再初始化包含相关系数γ、迭代次数Τ、噪声方差λ、对称半正定矩阵Α以及相关系数相对误差η的块稀疏贝叶斯学习方法参数；

步骤三：根据原始数据中的光谱特征，基于一阶偏差和二阶偏差来计算光谱中的吸收峰位置；

步骤四：根据计算得到的吸收峰位置，基于半峰高计算谱峰的峰宽；

步骤五：根据每个块的稀疏度控制系数计算块的对称半正定矩阵、相关性结构矩阵和相关系数；

步骤六：基于代价函数计算原始数据中每个块的误差值，并筛选稀疏块；

步骤七：计算光谱后验概率的期望和方差；

步骤八：利用最小化代价函数求解超参数，并更新初始化参数中的噪声方差λ；

步骤九：计算块相关系数的相对误差及当前迭代次数，若相对误差小于设定误差系数η或当前迭代次数大于设定迭代次数Τ，则转至步骤十，否则转至步骤五；

步骤十：利用光谱后验概率的期望，确定最终的茶叶稀疏重构数据并输出。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤二中，块稀疏贝叶斯学习方法优化函数如下：

L＝log|λΙ+ΩΣ ₀Ω ^T|+y ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，I表示单位矩阵，y表示光谱的压缩矩阵，
是测量矩阵，
是所有块的方差矩阵，表示为：

Σ ₀＝diag{γ ₁Β ₁,…,γ _iΒ _i,…,γ _gΒ _g}

其中，γ _i表示第i个块的块相关系数，B _i表示第i个块的结构矩阵。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤三中，谱峰位置确定计算如下：

Δx _j＝x _j-x _j-1

Δ ²x _j＝Δx _j-Δx _j-1

s.t.Δx _j＝0 andΔ ²x _j＜0

其中，Δx _j和Δ ²x _j分别是谱峰顶点x _j的一阶偏差和二阶偏差。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤四中，谱峰宽度的计算表示如下：

其中，n和m分别是x _n和x _m的索引，相对高度差H表示如下：

其中，x _i和x _k分别是谱峰的起始点和终止点。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤五中，对称半正定矩阵、相关性结构矩阵和相关系数表示如下：

其中，
和
d _i是第i个块的大小。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤六中，代价函数误差计算如下：

L＝log|λΙ+ΩΣ ₀Ω ^T|+y ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，
是测量矩阵，
是所有块的方差矩阵，表示为：

其中，
表示第i块在第t步迭代时块的方差矩阵。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤七中，后验概率期望计算如下：

μ _x＝Σ ₀Ω ^T(λΙ+ΩΣ ₀Ω ^T) ^-1y

其中，y表示为经过测量矩阵Ω得到光谱的压缩矩阵。
根据权利要求1所述的茶叶近红外光谱分析中谱峰自动检测与重构方法，其特征在于：所述步骤九中，相对误差判断条件表示如下：

其中，γ ^(t)是第t次迭代的相关系数。
茶叶近红外光谱分析中谱峰自动检测与重构系统，其特征在于，包括：

样本采集模块，用于采集茶叶样本，获取茶叶近红外光谱数据，形成原始数据；

参数初始化模块，用于获取原始数据，并初始化块稀疏贝叶斯学习方法参数，初始化参数包含：相关系数γ、迭代次数Τ、噪声方差λ、对称半正定矩阵Α以及相关系数相对误差η；

谱峰位置计算模块，用于根据光谱数据的一阶、二阶偏差确定吸收峰的位置；

谱峰宽度计算模块，用于根据吸收峰的半峰高确定峰宽；

相关系数计算模块，用于计算每个块的稀疏度控制系数，得到相关系数；

筛选模块，用于根据代价函数计算每个块的误差值，并筛选稀疏块；

期望和方差计算模块，用于根据光谱的后验概率分布，得到期望和方差；

噪声方差更新模块，用于根据最小化代价函数求解超参数，得到噪声方差更新；

判断模块，用于计算块相关系数的相对误差及当前迭代次数，若相对误差小于设定误差系数η或当前迭代次数大于设定迭代次数Τ，则退出判断，否则重新调用计算块相关系数和块筛选模块进行稀疏重构的计算；

数据校正模块，用于利用光谱后验概率的期望，确定最终的茶叶稀疏重构数据并输出。