CN104573842B - 基于鲁棒回归建模预测烤片烟气一氧化碳的方法 - Google Patents
基于鲁棒回归建模预测烤片烟气一氧化碳的方法 Download PDFInfo
- Publication number
- CN104573842B CN104573842B CN201410384898.7A CN201410384898A CN104573842B CN 104573842 B CN104573842 B CN 104573842B CN 201410384898 A CN201410384898 A CN 201410384898A CN 104573842 B CN104573842 B CN 104573842B
- Authority
- CN
- China
- Prior art keywords
- flue gas
- data
- formula
- value
- carbon monoxide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/80—Management or planning
- Y02P90/84—Greenhouse gas [GHG] management systems
Abstract
本发明提供一种基于鲁棒回归建模预测烤片烟气一氧化碳的方法,通过已有的烤片理化数据和烟气CO数据建立从理化指标项到烟气CO的模型,对于未知烤片烟气CO样本,可以利用其理化成分数据直接预测烤片烟气CO值。本发明省去了由传统化学方式进行卷制、燃烧、捕捉烟气、检测等步骤;同时,采用鲁棒回归模型,可以有效地避免因理化数据或烟气数据中奇异值样本导致的弊端,很大程度上保证模型的健壮性,这点正是鲁棒回归建模优于普通线性回归建模的优点。实践证明,该模型能够有效地预测烤片的烟气CO值,极大地提高检测效率,降低检测成本。
Description
技术领域
本发明涉及一种基于鲁棒回归建模预测烤片烟气一氧化碳的方法,属于特定计算模型技术领域。
背景技术
烟草烟气是一种极为复杂的混合物,它是在卷烟抽吸过程中由烟草燃烧、裂解和蒸馏而产生的。卷烟制品对于人体的危害性是通过燃吸过程而产生的。烟气中的有害成分主要是在燃烧过程中形成,而烟气的化学特性是随烟叶原料内在化学成分的变化而变化的。因此,卷烟烟叶原料的化学特性决定了卷烟烟气的化学特性和安全性。一氧化碳(以下简称:CO)是烟草不完全燃烧的产物,直接影响人体健康。传统的烤片烟气CO数据的获得方式是检测烤片燃烧后的烟气中的化学成分指标。通过这种方式获得的烟气数据,需要将烤片卷制成卷烟燃烧后的烟气进行化学检测,检测过程费时费力且检测成本极高。
在线性回归建模中,模型是建立在一定假设条件基础上的,例如被观测样本误差为标准正态分布。如果误差的分布是非对称或者倾向于离群点,那么进行线性回归建模的假设是不成立的,参数的估计、置信区间以及其他计算的统计量都是不可靠的。这种情况下,用鲁棒回归进行模型的建立是非常有效的。鲁棒回归建模包含了一种健壮的拟合方法,与最小二乘法相比,对于数据中小部分的变异没有那么敏感,提高了模型的可信度。
鲁棒回归通过为每个数据点赋予一个权值进行建模。加权是自动的并且是重复的,这个过程叫做自动重加权最小二乘法。在第一阶段,每个样本点被赋予相同的权重,然后利用普通的最小二乘法计算得到模型系数。在随后的迭代中,每个样本的点都将重新计算,那些远离模型预测值的样本点将被赋予较低的权重。之后利用经过加权的最小二乘法计算模型系数。迭代过程将一直进行下去,一直到模型系数在一个设定的范围波动。
因此以鲁棒回归建立一种预测模型由烤片理化数据直接获取烟气CO数据的方法势在必行。
发明内容
为解决现有技术检测烤片烟气CO数据的过程费时、费力、成本极高等问题,本发明提出一种基于鲁棒回归建模预测烤片烟气一氧化碳的方法。
本发明通过已有的烤片理化数据和烟气CO数据建立从理化指标项到烟气CO的鲁棒回归预测模型,对于未知烤片烟气CO样本,利用其理化成分数据套用模型直接预测烤片烟气CO值。具体经过下列各步骤:
(1)将已知烤片的理化数据与烟气CO数据对应列出,建立数据样本集;
(2)分别计算步骤(1)所得数据样本集中各理化数据的列向量x1~xn和烟气CO数据的列向量y,通过下列公式分别计算各理化数据与烟气CO的线性相关系数r,线性相关系数r的绝对值大于0.3所对应的该项理化数据即为对烟气CO有重要影响的特征指标项,作为建模用的输入变量:
(1)
式中:x为某一理化数据的列向量,y为烟气CO数据的列向量;
(3)根据不同产地、品种、档次,均匀挑选245个烤片作为训练样本,运用鲁棒回归线性建模算法,建立烟气CO预测模型,其表达式为下式:
(2)
式中:Y为烟气CO的模型预测值,X为理化数据向量,b为常数项,A为回归系数向量;
(4)依据步骤(2)选择的特征指标项,将待测烤片的对应理化数据作为输入变量套用至步骤(3)的预测模型中,即能测算得到待测烤片的烟气CO的模型预测值Y。
所述步骤(1)的理化数据包括总糖、还原糖、烟碱、总挥发碱、总氮、烟碱氮、蛋白质、施木克值、氮碱比、氯、钾、糖碱比和氨态碱。
所述步骤(3)运用鲁棒回归线性建模算法的步骤如下:
(a)进行局部权重回归拟合:每一次拟合过程只考虑所有拟合点数的一部分,每一个被拟合点的取值都由与之邻近的局部拟合范围的散步点所决定,在每一个拟合点处都给予不同的权重系数,其权重系数在拟合点处为1,局部拟合范围内拟合点的两边各点的权重系数依次以一定的规则递减至零,超出拟合范围的数据点处的权重均为0,其代数表达式为:
式中:为每个拟合点的权重系数,为实测值,为计算值;
(b)按下式计算调整残差:
式中:为普通最小二乘法的残差,为残差调整杠杆值,用于降低影响拟合值较大点处的权重,T为转置;
标准调整残差由下式给出:
式中:K为调整参数,取4.685;s为鲁棒性偏差;MAD是残差的中值绝对偏差;
(c)按下式计算在局部拟合范围内每一点的鲁棒性权重:
(d)对于式(2),将常数项b纳入到回归系数向量中,则式(2)简化为:
依据权重最小二乘法求解使得下式取最小值的回归系数向量A,并计算在x0处的值:
式中:J为权重最小二乘法求解的目标函数。
所述步骤(d)的鲁棒性权重若其拟合误差未达到下列拟合误差要求时,从步骤(b)开始迭代计算,直至误差达到要求或达到限定迭代次数为止:
。
所述步骤(3)的预测模型通过下列各步骤对拟合性能和推广性能进行评价:
根据不同产地、品种、档次,均匀挑选45个与步骤(3)不同的烤片理化数据作为测试样本,套用至步骤(3)的预测模型中进行性能测试,预测结果需同时满足如下两个条件,即判定模型性能达到预测要求:
A、测试样本与训练样本的预测平均误差相当,即为下式所示:
式中:errtrain为预测模型对训练样本的平均误差,errtest为预测模型对测试样本的平均误差;
B、测试样本的预测值与实际值呈显著的线性相关关系,即为下式所示:
式中:为测试样本的预测值,y为测试样本的实测值(该实测值是通过传统方法测得)。
本发明与现有技术相比,具备以下优点和效果:通过已有的烤片理化数据和烟气CO数据建立从理化指标项到烟气CO的模型,对于未知烤片烟气CO样本,可以利用其理化成分数据直接预测烤片烟气CO值。运用鲁棒回归线性建模算法,建模过程中寻找最终预测模型中合适的向量A和常数项b,使得烟气CO预测模型的表达式中计算值尽可能拟合实测值。本发明省去了由传统化学方式进行卷制、燃烧、捕捉烟气、检测等步骤;同时,采用鲁棒回归模型,可以有效地避免因理化数据或烟气数据中奇异值样本导致的弊端,很大程度上保证模型的健壮性,这点正是鲁棒回归建模优于普通线性回归建模的优点。实践证明,该模型能够有效地预测烤片的烟气CO值,极大地提高检测效率,降低检测成本。
附图说明
图1为本发明的建模流程示意图。
具体实施方式
下面通过实施例对本发明做进一步说明。
实施例1
(1)将已知烤片的理化数据与烟气CO数据对应列出,建立数据样本集,其中理化数据包括总糖、还原糖、烟碱、总挥发碱、总氮、烟碱氮、蛋白质、施木克值、氮碱比、氯、钾、糖碱比和氨态碱,如下表所示:
(2)分别计算步骤(1)所得数据样本集中各理化数据的列向量x1~xn和烟气CO数据的列向量y,通过下列公式分别计算各理化数据与烟气CO的线性相关系数r:
(1)
式中:x为某一理化数据的列向量,y为烟气CO数据的列向量;得到所有烤片的理化数据与烟气CO的线性相关系数r,如下表所示:
再以绝对值大于0.3的线性相关系数r在理化数据中对应选择对烟气CO有重要影响的特征指标项,作为建模用的输入变量,即选择氯、钾:
(3)根据不同产地、品种、档次,均匀挑选245个烤片作为训练样本,运用鲁棒回归线性建模算法,建立烟气CO预测模型,其表达式为下式:
(2)
式中:Y为烟气CO的模型预测值,X为理化数据向量,b为常数项,A为回归系数向量;
其中用鲁棒回归线性建模算法的步骤如下:
(a)进行局部权重回归拟合:每一次拟合过程只考虑所有拟合点数的一部分,每一个被拟合点的取值都由与之邻近的局部拟合范围的散步点所决定,在每一个拟合点处都给予不同的权重系数,其权重系数在拟合点处为1,局部拟合范围内拟合点的两边各点的权重系数依次以一定的规则递减至零,超出拟合范围的数据点处的权重均为0,其代数表达式为:
式中:为每个拟合点的权重系数,为实测值,为计算值;
(b)按下式计算调整残差:
式中:为普通最小二乘法的残差,为残差调整杠杆值,用于降低影响拟合值较大点处的权重,T为转置;
标准调整残差由下式给出:
式中:K为调整参数,取4.685;s为鲁棒性偏差;MAD是残差的中值绝对偏差;
(c)按下式计算在局部拟合范围内每一点的鲁棒性权重:
(d)对于式(2),将常数项b纳入到回归系数向量中,则式(2)简化为:
依据权重最小二乘法求解使得下式取最小值的回归系数向量A,并计算在x0处的值:
式中:J为权重最小二乘法求解的目标函数;
若其拟合误差未达到下列拟合误差要求时,从步骤(b)开始迭代计算,直至误差达到要求或达到限定迭代次数为止:
;
由上述运算得到a1=1.35784、a2=-0.53972,b=13.25193;
因此,该烟气CO预测模型的表达式为:Y=13.25193+1.35784*氯-0.53972*钾;
对上述预测模型通过下列各步骤评价其拟合性能和推广性能:
以上述预测模型对训练样本进行预测,其结果见下表:
根据不同产地、品种、档次,均匀挑选45个与步骤(3)不同的烤片理化数据作为测试样本,套用至步骤(3)所得的预测模型中进行性能测试,以上述预测模型对测试样本进行预测,结果见下表:
上述预测结果需同时满足如下两个条件,即判定模型性能达到预测要求:
A、测试样本与训练样本的预测平均误差相当,为0.15,即为下式所示:
式中:errtrain为预测模型对训练样本的平均误差=0.678,errtest为预测模型对测试样本的平均误差=0.772;
B、测试样本的预测值与实际值呈显著的线性相关关系,r=0.8274,即为下式所示:
式中:为测试样本的预测值,y为测试样本的实测值(该实测值是通过传统方法测得);
依据预测模型的评价结果,测试样本的线性相关关系为0.8274,表征了该预测模型能够很好的拟合测试样本;测试样本的平均误差与训练样本的平均误差相当,表征了该预测模型具有较好的推广性能;
(4)依据步骤(2)选择的特征指标项,将待测烤片的对应理化数据,即氯=0.37、钾=1.86作为输入变量套用至步骤(3)的预测模型中,即能测算得到待测烤片的烟气CO的模型预测值Y=13.25193+1.35784*氯-0.53972*钾=12.75。为验证模型预测结果的可靠性,采用传统检测方法,测定该烤片的烟气CO值为:12.7。
实施例2
与实施例1的步骤(1)~(3)相同,仅替换其它待测烤片,步骤(4)如下操作:
依据步骤(2)选择的特征指标项,将待测烤片的对应理化数据,即氯=0.23、钾=1.91作为输入变量套用至步骤(3)的预测模型中,即能测算得到待测烤片的烟气CO的模型预测值Y=13.25193+1.35784*氯-0.53972*钾=12.533。为验证模型预测结果的可靠性,采用传统检测方法,测定该烤片的烟气CO值为:12.2。
实施例3
与实施例1的步骤(1)~(3)相同,仅替换其它待测烤片,步骤(4)如下操作:
依据步骤(2)选择的特征指标项,将待测烤片的对应理化数据,即氯=0.37、钾=2.03作为输入变量套用至步骤(3)的预测模型中,即能测算得到待测烤片的烟气CO的模型预测值Y=13.25193+1.35784*氯-0.53972*钾=12.659。为验证模型预测结果的可靠性,采用传统检测方法,测定该烤片的烟气CO值为:12.8。
Claims (2)
1.一种基于鲁棒回归建模预测烤片烟气一氧化碳的方法,其特征在于经过下列各步骤:
(1)将已知烤片的理化数据与烟气一氧化碳数据对应列出,建立数据样本集;所述步骤(1)的理化数据包括总糖、还原糖、烟碱、总挥发碱、总氮、烟碱氮、蛋白质、施木克值、氮碱比、氯、钾、糖碱比和氨态碱;
(2)分别计算步骤(1)所得数据样本集中各理化数据的列向量x1~xn和烟气一氧化碳数据的列向量y,通过下列公式分别计算各理化数据与烟气一氧化碳的线性相关系数r,线性相关系数r的绝对值大于0.3所对应的该项理化数据即为对烟气一氧化碳有重要影响的特征指标项,作为建模用的输入变量:
式中:x为某一理化数据的列向量,y为烟气一氧化碳数据的列向量;
(3)根据不同产地、品种、档次,均匀挑选245个烤片作为训练样本,运用鲁棒回归线性建模算法,建立烟气一氧化碳预测模型,其表达式为下式:
Y=AX+b=a1x1+a2x2+…+anxn+b (2)
式中:Y为烟气一氧化碳的模型预测值,X为理化数据向量,b为常数项,A为回归系数向量;所述运用鲁棒回归线性建模算法的步骤如下:
(a)进行局部权重回归拟合:每一次拟合过程只考虑所有拟合点数的一部分,每一个被拟合点的取值都由与之邻近的局部拟合范围的散步点所决定,在每一个拟合点处都给予不同的权重系数Wi,其权重系数在拟合点处为1,局部拟合范围内拟合点的两边各点的权重系数依次以一定的规则递减至零,超出拟合范围的数据点处的权重均为0,其代数表达式为:
式中:Wi为每个拟合点的权重系数,yi为实测值,为计算值;
(b)按下式计算调整残差:
h=X(XTX)-1XT
式中:ri为普通最小二乘法的残差,hi为残差调整杠杆值,用于降低影响拟合值较大点处的权重,T为转置;
标准调整残差由下式给出:
式中:K为调整参数,取4.685;s为鲁棒性偏差;MAD是残差的中值绝对偏差;
(c)按下式计算在局部拟合范围内每一点的鲁棒性权重:
(d)对于式(2),将常数项b纳入到回归系数向量中,则式(2)简化为:
Y=a1x1+a2x2+…+anxn+b
=(a1,a2,…,an,b)×(x1,x2,…,xn,1)T
=AX
依据权重最小二乘法求解使得下式取最小值的回归系数向量A,并计算在x0处的值:
式中:J为权重最小二乘法求解的目标函数;
所述步骤(3)的预测模型通过下列各步骤对拟合性能和推广性能进行评价:
根据不同产地、品种、档次,均匀挑选45个与步骤(3)不同的烤片理化数据作为测试样本,套用至步骤(3)的预测模型中进行性能测试,预测结果需同时满足如下两个条件,即判定模型性能达到预测要求:
A、测试样本与训练样本的预测平均误差相当,即为下式所示:
式中:errtrain为预测模型对训练样本的平均误差,errtest为预测模型对测试样本的平均误差;
B、测试样本的预测值与实际值呈显著的线性相关关系,即为下式所示:
式中:为测试样本的预测值,y为测试样本的实测值;
(4)依据步骤(2)选择的特征指标项,将待测烤片的对应理化数据作为输入变量套用至步骤(3)的预测模型中,即能测算得到待测烤片的烟气一氧化碳的模型预测值Y该烟气CO预测模型的表达式为:Y=13.25193+1.35784*氯-0.53972*钾。
2.根据权利要求1所述的基于鲁棒回归建模预测烤片烟气一氧化碳的方法,其特征在于:所述步骤(d)的鲁棒性权重若其拟合误差未达到下列拟合误差要求时,从步骤(b)开始迭代计算,直至误差达到要求或达到限定迭代次数为止:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410384898.7A CN104573842B (zh) | 2014-08-07 | 2014-08-07 | 基于鲁棒回归建模预测烤片烟气一氧化碳的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410384898.7A CN104573842B (zh) | 2014-08-07 | 2014-08-07 | 基于鲁棒回归建模预测烤片烟气一氧化碳的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104573842A CN104573842A (zh) | 2015-04-29 |
CN104573842B true CN104573842B (zh) | 2018-11-06 |
Family
ID=53089858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410384898.7A Active CN104573842B (zh) | 2014-08-07 | 2014-08-07 | 基于鲁棒回归建模预测烤片烟气一氧化碳的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104573842B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105628646B (zh) * | 2015-12-30 | 2019-03-22 | 山东中烟工业有限责任公司 | 一种卷烟在线焦油预测及预警方法 |
CN111723342B (zh) * | 2020-06-22 | 2023-11-07 | 杭州电力设备制造有限公司 | 一种基于弹性网络回归模型的变压器顶层油温预测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5146541A (en) * | 1989-06-19 | 1992-09-08 | The United States Of America As Represented By The Secretary Of The Navy | Signal phase pattern sensitive neural network system and method |
CN101419207A (zh) * | 2008-10-27 | 2009-04-29 | 川渝中烟工业公司 | 烤烟烟气主要指标的预测方法 |
CN102879531A (zh) * | 2012-10-11 | 2013-01-16 | 云南烟草科学研究院 | 一种初烤烟叶主流烟气中氨释放量的预测方法 |
CN103020737A (zh) * | 2012-12-12 | 2013-04-03 | 红塔烟草(集团)有限责任公司 | 一种烤片烟气的预测方法 |
-
2014
- 2014-08-07 CN CN201410384898.7A patent/CN104573842B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5146541A (en) * | 1989-06-19 | 1992-09-08 | The United States Of America As Represented By The Secretary Of The Navy | Signal phase pattern sensitive neural network system and method |
CN101419207A (zh) * | 2008-10-27 | 2009-04-29 | 川渝中烟工业公司 | 烤烟烟气主要指标的预测方法 |
CN102879531A (zh) * | 2012-10-11 | 2013-01-16 | 云南烟草科学研究院 | 一种初烤烟叶主流烟气中氨释放量的预测方法 |
CN103020737A (zh) * | 2012-12-12 | 2013-04-03 | 红塔烟草(集团)有限责任公司 | 一种烤片烟气的预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104573842A (zh) | 2015-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104102851B (zh) | 基于鲁棒回归建模预测烤片烟气苯并芘的方法 | |
CN107862456B (zh) | 一种批次烟叶质量综合评价的方法 | |
WO2019085369A1 (zh) | 一种电子鼻仪器和烟草与烟草制品感官质量评价方法 | |
CN101419207B (zh) | 烤烟烟气主要指标的预测方法 | |
CN107563672A (zh) | 一种基于层次分析法构建卷烟制丝质量评价模型的方法 | |
CN104573842B (zh) | 基于鲁棒回归建模预测烤片烟气一氧化碳的方法 | |
CN111125908A (zh) | 基于极限学习机的面包生产建模及决策参数优化方法 | |
CN103020737A (zh) | 一种烤片烟气的预测方法 | |
CN113190967B (zh) | 一种基于多目标筛选的细支卷烟材料组配方法 | |
CN110013048A (zh) | 一种适用于细支卷烟的烟丝结构确定方法和装置 | |
CN103344572A (zh) | 一种梗丝、再造烟丝在卷烟中掺配均匀性的评价方法 | |
CN104143051B (zh) | 基于鲁棒回归建模预测烤片烟气苯酚的方法 | |
CN104134007B (zh) | 基于鲁棒回归建模预测烤片烟气nnk的方法 | |
CN112668809A (zh) | 建立自闭症儿童康复效果预测模型的方法、预测自闭症儿童康复效果的方法及系统 | |
Chakraborty et al. | Comparison between multiresponse‐robust process design and numerical optimization: A case study on baking of fermented chickpea flour‐based wheat bread | |
CN104143050B (zh) | 基于鲁棒回归建模预测烤片烟气氰化氢的方法 | |
CN104101691B (zh) | 基于鲁棒回归建模预测烤片烟气烟气氨的方法 | |
CN104123424B (zh) | 基于鲁棒回归建模预测烤片烟气巴豆醛的方法 | |
CN116735811B (zh) | 一种酒总酸和总酯含量的测定方法及测定系统 | |
CN108120694B (zh) | 用于晒红烟化学成分分析的多元校正方法及系统 | |
CN105787518B (zh) | 一种基于零空间投影的近红外光谱预处理方法 | |
CN112884203A (zh) | 一种基于贝叶斯支持向量回归的二噁英排放在线预测方法 | |
CN108520276A (zh) | 一种烟叶原料内在感官质量的表征方法 | |
Metzger et al. | Games and frames: A strange tale of qoe studies | |
CN111610146A (zh) | 一种模拟脆性固体时离散元粘结参数的自动标定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |