CN112258019A - 一种煤耗的评估方法 - Google Patents
一种煤耗的评估方法 Download PDFInfo
- Publication number
- CN112258019A CN112258019A CN202011118959.7A CN202011118959A CN112258019A CN 112258019 A CN112258019 A CN 112258019A CN 202011118959 A CN202011118959 A CN 202011118959A CN 112258019 A CN112258019 A CN 112258019A
- Authority
- CN
- China
- Prior art keywords
- coal
- data
- model
- matrix
- representing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003245 coal Substances 0.000 title claims abstract description 161
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000012360 testing method Methods 0.000 claims abstract description 69
- 238000012549 training Methods 0.000 claims abstract description 69
- 238000011156 evaluation Methods 0.000 claims abstract description 45
- 238000002790 cross-validation Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 13
- 238000013499 data model Methods 0.000 claims abstract description 8
- 238000001514 detection method Methods 0.000 claims abstract description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 6
- 238000004140 cleaning Methods 0.000 claims abstract description 4
- 238000007619 statistical method Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 74
- 238000012417 linear regression Methods 0.000 claims description 29
- 238000012216 screening Methods 0.000 claims description 19
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 claims description 17
- 229910052717 sulfur Inorganic materials 0.000 claims description 17
- 239000011593 sulfur Substances 0.000 claims description 17
- 230000001419 dependent effect Effects 0.000 claims description 16
- 238000010586 diagram Methods 0.000 claims description 14
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 claims description 11
- 229910052799 carbon Inorganic materials 0.000 claims description 11
- 238000009826 distribution Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 4
- 230000020169 heat generation Effects 0.000 claims description 3
- 239000000919 ceramic Substances 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000010304 firing Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 239000003039 volatile agent Substances 0.000 description 3
- 239000003034 coal gas Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000011234 economic evaluation Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910052573 porcelain Inorganic materials 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0206—Price or cost determination based on market factors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Finance (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Accounting & Taxation (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Manufacturing & Machinery (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种煤耗的评估方法,包括确定测评的各项指标数据;对各项指标数据进行检查清洗,计算数据中的各项指标值;对数据进行标准化处理;建立数据模型,进行模型分析,对数据模型训练和测试,对上述模型进行假设检验和交叉验证,设置训练集和测试集,以训练集做模型训练,以测试集对模型训练结果进行测试;对模型进行检验,包括:使用统计分析对上述模型进行检验,使用常态化残差和学生化残差做模型评估检测,根据模型检验,分析判断评价结果。本发明通过建立多个模型,把多种煤耗因素集合起来,提出综合评价体系,有效减小了人为因素对评价结果造成的干扰和影响。
Description
技术领域
本发明涉及高耗能行业经济型测评技术领域,尤其涉及一种煤耗的评估方法。
背景技术
建筑陶瓷使用煤制气作为主要能源,其中烧煤占企业直接生产成本5%左右,煤制气生产过程直接影响生产的稳定性,并在烧制过程中影响陶瓷制品的优等品率。烧煤工艺及材料不好,有可能引起安全事故;煤块中的硫含量,直接影响环保排放指标。影响煤耗的主要因素是煤炭的质量,烧成工艺和烧煤装备。
目前行业内计算产品煤耗指标的方式分为两种,即吨瓷耗煤量和平米瓷砖用煤量。对于煤炭的价格、质量等多种因素并未进行测算和计量;对于多种不同规格的瓷砖的耗煤量也没有进行区分。实际影响煤耗的因素非常复杂,有许多指标都反映了煤耗的优劣,要将所有的因素都罗列出来,并且确定它们之间的关系在现有的计算模型中是不可能的。目前,对煤耗的综合测评方法,主要是依靠统计人员凭借自身的经验进行评价,还没有专门针对建筑陶瓷煤耗的综合评价方法。
但是依靠各企业的自身经验进行煤耗的优劣评价,存在一些弊端。由于各个企业对于产品煤耗的评价标准不同,经验水平不同,致使不同企业对于煤耗的评价差异非常大,行业内没有比较客观完善的煤耗评价方法。
现有煤耗测评方法中,仅计算煤炭用量与瓷砖产量的关系,对于煤炭的价格、质量和产品的规格未进行综合评价,在计算成本时,未能准确地反映实际煤炭单耗的成本。同时,各个计量人员的经验和水平不同,实际计算方法差异很大,导致目前建筑陶瓷企业普遍使用的煤耗计量方法,过于简单粗放,评价结果不客观,未能实际反映行业的平均水平。
发明内容
本发明的目的在于针对背景技术中的缺陷,提出一种煤耗的评估方法,以解决背景技术中的问题。
为达此目的,本发明采用以下技术方案:
一种煤耗的评估方法,具体步骤如下:
确定测评的各项指标数据,包括定量数据和定性数据,其中,定量数据包括:
与煤炭价格相关的数据指标:矿口价、运费、工厂采购价和煤炭单耗成本;
与煤炭质量相关的数据指标:发热量、全水、固定碳、含硫量、软化温度和灰分;
定性数据包括:四个实验场所;
对各项指标数据进行检查清洗,计算数据中的各项指标值;
对数据进行标准化处理;
建立数据模型,进行模型分析,对数据模型训练和测试,包括:
建立线性回归模型、多元回归模型、多元逐步选择线性回归模型、岭回归模型和拉索回归模型,设置训练集和测试集,分别代入以上模型,以训练集做模型训练,以测试集对模型训练结果进行测试,对上述模型进行假设检验和交叉验证;
对模型进行检验,包括:
使用统计分析对上述模型进行检验,使用常态化残差和学生化残差做模型评估检测
根据模型检验,分析判断评价结果。
优选的,对数据进行标准化处理,包括:
使用公式一进行标准化处理;
其中:
X表示处理后的新数据;
Xi‘表示原始样本数据;
μ表示所有样本数据的均值;
σ表示所有样本数据的标准差。
优选的,将经过标准化处理的数据指标,以煤炭单耗成本为因变量,其他定量数据为自变量,绘制散点图矩阵,根据散点图矩阵确定多个变量之间的主要相关性;
根据数据指标,绘制直方图,查看因变量的分布情况,确定因变量的值的选取;
根据线性回归模型,通过公式二获取煤炭单耗成本与工厂采购价的关系;
Y=β0+β1X1‘+ε--公式二;
其中:
Y表示煤炭单耗列矩阵;
β0表示线性方程截距;
X1‘表示煤炭采购价格的列矩阵;
βi‘表示线性参数;
ε表示未观测的随机成份;
根据公式三获取煤炭单耗成本与工厂采购价的相关系数;
其中:
Y表示煤炭单耗列矩阵;
X1‘表示煤炭采购价格的列矩阵;
xi表示煤炭采购价格;
yi表示煤炭单耗成本;
Cor(X,Y)表示煤炭单耗成本与煤炭采购价格的相关系数;
i=1,2,…,n,表示n个煤炭采购价格数据或煤炭单耗成本数据中的其中一个。
优选的,根据多元回归模型,使用公式四做多元线性回归;
Y=β0+β1X1+β2X2+…+β10X10+ε--公式四;
其中:
Y表示煤炭单耗列矩阵;
β0表示线性方程截距;
β1表示运费估计系数;
X1表示运费列矩阵;
β2表示矿口价格估计系数;
X2表示矿口价格列矩阵;
β3表示发热量估计系数;
X3表示发热量矩阵;
β4表示全水分Mt估计系数;
X4表示全水分Mt矩阵;
β5表示含硫量估计系数;
X5表示含硫量矩阵;
β6表示挥发分估计系数;
X6表示挥发分矩阵;
β7表示固定碳估计系数;
X7表示固定碳矩阵;
β8表示灰熔融性软化温度估计系数;
X8表示灰熔融性软化温度矩阵;
β9表示工厂采购价估计系数;
X9表示工厂采购价矩阵;
β10表示灰分估计系数;
X10表示灰分矩阵;
ε表示未观测的随机成份。
优选的,根据多元逐步选择线性回归模型,做多元线性回归的变量筛选,包括:
对多个变量进行逐步筛选,根据每个变量与多元逐步选择线性回归模型的关联度,筛选出多个表现显著的变量。
优选的,将数据指标分为训练集和测试集;
使用公式五,训练岭回归,设置十折交叉验证,包括:
其中:
I表示单位矩阵;
λ表示岭系数;
X′表示属性矩阵,即上述定量数据等因变量属性构成的矩阵;
X′T表示X属性矩阵的转置;
Y表示煤炭单耗列矩阵;
使用公式六进行k折交叉验证;
其中:
CV表示交叉验证误差;
k表示划分原始数据的组数;
MSE表示均方误差;
I表示将所有的均方误差加起来。
优选的,将训练集进入岭回归模型进行拟合,使用最优lambda和1折 lambda进行训练,获取训练集最优lambda训练结果和1折lambda训练结果;
再将测试集进入岭回归模型进行测试,获取平均最优lambda测试结果和平均1折lambda测试结果。
优选的,根据拉索回归模型,使用公式七,训练拉索回归,设置十折交叉验证,包括:
Flasso=‖Y-X′w‖2 2+λ′‖w‖1--公式七;
其中:
Flasso表示拉索回归的损失函数;
Y表示煤炭单耗列矩阵;
X′表示属性矩阵,即上述定量数据等因变量属性构成的矩阵;
λ′表示自定义系数,分别是1折lambda和最优lambda;
w表示无偏估计系数;
将训练集进入拉索回归模型进行拟合,使用最优lambda和1折lambda 进行训练,获取训练集最优lambda训练结果和1折lambda训练结果;
再将测试集进入拉索回归模型进行测试,获取平均最优lambda测试结果和平均1折lambda测试结果。
优选的,比较岭回归模型和拉索回归模型,选取其中一个模型作为煤耗测评的基础模型,根据其最优lambda训练结果,获取各个试验场所的煤炭单耗测评结果。
有益效果:
本发明的整个煤耗分析模型是由多个模型组成的,其中关系是层层递进。先做简单线性回归,确认相关联的关系;再做多元线性回归,看其中的影响煤耗的主要因素有哪些;然后做逐步多元回归,分析结果;最后做岭回归和拉索回归,排除各变量之间的多重共线性影响,根据比较结果判断选择岭回归模型还是拉索回归模型作为基础模型,根据其最优lambda训练结果,获取各个试验场所的煤炭单耗测评结果;
本发明充分考虑煤耗评价系统的普遍性,把多种煤耗评价因素集合起来,提出综合评价体系,避免过度追求煤价低廉,或者追求煤炭质量越高越好的倾向,本评价体系说明煤炭价格到达一定程度时,煤炭的单耗就是由多种因素集合构成,不能单独计算煤炭的价格或单位煤耗量来解释煤耗成本。有效减小了人为因素对评价结果造成的干扰和影响。有效减少了行业内对煤耗的评价多重方案,多个计算公式的干扰,实行了科学客观的评价体系;
附图说明
图1是本发明的指标体系流程图;
图2是本发明的散点图;
图3是本发明的直方图;
图4为本发明的QQ残差图;
图5为本发明的强影响点观察图;
图6为本发明的分布水平图;
图7为本发明的成分残差图;
图8为本发明的岭回归图;
图9为本发明的岭回归均方误差图;
图10为本发明的拉索回归图;
图11为本发明的拉索回归均方误差图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
本发明的一种煤耗的评估方法,具体步骤如下:
基于数据挖掘及数据分析确定测评的各项指标数据,包括定量数据和定性数据,其中,定量数据包括:
与煤炭价格相关的数据指标:矿口价、运费、工厂采购价和煤炭单耗成本;
与煤炭质量相关的数据指标:发热量、全水、固定碳、含硫量、软化温度和灰分;
定性数据包括:四个实验场所,具体的为4个参与实验的工厂,以独热编码显示,参与实验的4个工厂,均为建筑陶瓷生产工厂,生产环境正常,生产条件良好,期间使用煤炭均为质量达标的建筑陶瓷用煤。建筑陶瓷制气用煤标准详见《建筑陶瓷制气用块煤标准》(T/FSCIA 002-2017);
具体的,在本实施例中,有A、B、C、D四间工厂,采用独热编码进入模型
独热编码即One-Hot编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。
A工厂:100;
B工厂:010;
C工厂:001;
D工厂:000;
本发明采用的各种数据指标说明如下:
煤炭单耗成本UnitConsum;
煤炭运费Freight:运费;
煤炭运费/吨煤炭(单位:元);
发热量CalorificValue;
收到基低位发热量Qnet.v.ar(单位:卡/克);
挥发分VolatileMatter;
空干基挥发分Vad(单位:%);
灰分ash;
空干基灰分Aad(单位:%);
含硫量sulfur;
空干基全硫St,ad(单位:%);
固定碳FixedCarbon;
空干基固定碳FCad(单位:%);
水分Mt;
全水分Mt(单位:%);
软化温度ST;
灰熔融性软化温度ST(单位:℃);
矿口价univalent;
煤炭矿口裸价价格/吨(单位:元);
工厂采购价BuyingPrice;
煤炭运输到工厂的价格价格/吨(单位:元);
对各项指标数据进行检查清洗,计算数据中的各项指标值,在本实施例中,各项指标数据来源为四家陶瓷企业2018年1月至2018年10月的煤炭使用数据,所有煤炭检测数据均为工厂及煤炭检测机构的检测数据;单位煤耗的计算公式为:每公斤煤炭采购价格/每平米消耗煤炭量(公斤),每平米消耗煤炭量(公斤)为按照工厂统计提供数据计算。
对数据进行标准化处理,因为各项数据的指标不一样,计量单位不一致,数据大小相差较大,经过标准化处理后的数据,进入模型计算可以达到两个目的:1,提升模型的收敛速度;2、提升模型的精度;
建立数据模型,进行模型分析,对数据模型训练和测试,包括:
建立线性回归模型、多元回归模型、多元逐步选择线性回归模型、岭回归模型和拉索回归模型,对上述模型进行假设检验和交叉验证,将上述模型分成训练集和测试集,以训练集做模型训练,以测试集对模型训练结果进行测试;
本发明的整个煤耗分析模型是由多个模型组成的,其中关系是层层递进。先做简单线性回归,确认相关联的关系;再做多元线性回归,看其中的影响煤耗的主要因素有哪些;然后做逐步多元回归,分析结果;最后做岭回归和拉索回归,排除各变量之间的多重共线性影响。
对模型进行检验,包括:
使用统计分析对上述模型进行检验,使用常态化残差和学生化残差做模型评估检测
根据模型检验,分析判断评价结果,包括分析判断综合煤耗测评方法成立,对参加评价的企业煤耗情况评估准确。当需要对新的数据做分析时,按照模型体系设定方法,将数据放入模型中继续训练即可获得评价结果。
优选的,对数据进行标准化处理,包括:
使用公式一进行标准化处理;Xi‘
其中:
X表示处理后的新数据;
Xi‘表示原始样本数据;
μ表示所有样本数据的均值;
σ表示所有样本数据的标准差。
优选的,将经过标准化处理的数据指标,以煤炭单耗成本UnitConsum为因变量(响应变量),其他定量数据为自变量(解释变量),绘制散点图矩阵,如图2所示,看散点图的点位走势,可以看出,煤炭单耗与采购价存在线性相关,运费与矿口价存在线性相关。根据散点图矩阵确定多个变量之间的主要相关性,在进行多元线性回归时尤为重要;
根据数据指标,绘制直方图,确定因变量的值的选取,如图3所示,通过两个图对比,可以看出煤耗的原始数据更加趋向于正态分布,直方图的X轴上是煤耗的数据,Y轴反映煤耗的变动值。因变量可以取原始值,也可以取log值。通过直方图的反映,可以看出原始数据y更加趋向于正态分布,而log(y)的正态分布较差,因此选择原始数据y做因变量;
根据线性回归模型,根据公式二获取煤炭单耗成本与工厂采购价的关系;
Y=β0+β1X1‘+ε--公式二;
其中:
Y表示煤炭单耗列矩阵;
β0表示线性方程截距;
X1‘表示煤炭采购价格的列矩阵;
βi‘表示线性参数;
ε表示未观测的随机成份;
根据公式三获取煤炭单耗成本与工厂采购价的相关系数;
其中:
Y表示煤炭单耗列矩阵;
X1‘表示煤炭采购价格的列矩阵;
xi表示煤炭采购价格;
yi表示煤炭单耗成本;
Cor(X,Y)表示煤炭单耗成本与煤炭采购价格的相关系数;
i=1,2,…,n,表示n个煤炭采购价格数据或煤炭单耗成本数据中的其中一个;
经过计算后,可以得知煤炭单耗成本与工厂采购价呈现正相关。
优选的,根据多元回归模型,使用公式四做多元线性回归;
Y=β0+β1X1+β2X2+…+β10X10+ε--公式四;
其中:
Y表示煤炭单耗列矩阵;
β0表示线性方程截距;
β1表示运费估计系数;
X1表示运费列矩阵;
β2表示矿口价格估计系数;
X2表示矿口价格列矩阵;
β3表示发热量估计系数;
X3表示发热量矩阵;
β4表示全水分Mt估计系数;
X4表示全水分Mt矩阵;
β5表示含硫量估计系数;
X5表示含硫量矩阵;
β6表示挥发分估计系数;
X6表示挥发分矩阵;
β7表示固定碳估计系数;
X7表示固定碳矩阵;
β8表示灰熔融性软化温度估计系数; X8表示灰熔融性软化温度矩阵;
β9表示工厂采购价估计系数;
X9表示工厂采购价矩阵;
β10表示灰分估计系数;
X10表示灰分矩阵;
ε表示未观测的随机成份;
如表一所示:
残差显示: | |
最小值 | -2.47525 |
第一四分位数 | -0.49715 |
中位数 | -0.08186 |
第三四分位数 | 0.59353 |
最大值 | 1.79563 |
如表二所示,表二为多元回归系数;
多元回归计算之后,通过第四列P值可以看出,在解释变量中,挥发分表现为非常显著,截距、含硫量和软化温度表现为比较显著。
本实施例经过计算后得出:
残差标准误(Residual standard error):自由度为0.4668;
拟合优度(Multiple R-squared):0.3455;
修正的拟合优度(Adjusted R-squared):0.2919;
F检验:6.441在10和122DF上,p值:6.443e-0;
优选的,根据多元逐步选择线性回归模型,做多元线性回归的变量筛选,包括:
对多个变量进行逐步筛选,根据每个变量与多元逐步选择线性回归模型的关联度,筛选出多个表现显著的变量,筛选是多元回归的一个升级模型,就是逐步筛选,分为前向和后向筛选,把变量逐步放入模型测试的过程。筛选的标准就是这个变量与整个模型的关联度。
经过多元线性回归的变量筛选之后,如表三所示:
残差显示: | |
最小值 | -2.49200 |
第一四分位数 | -0.50695 |
中位数 | -0.08957 |
第三四分位数 | 0.55741 |
最大值 | 1.80434 |
可以看出,残差显示略有提升。
如表4所示,多元回归系数显示:
经过筛选,变量从10个减少到8个,通过第四列P值(概率)可以看出,在解释变量中,挥发分继续表现为非常非常显著,运费、全水、软化温度和采购价表现为比较显著,发热量和含硫量表现为显著。
残差标准误(Residual standard error):自由度0.4648;
拟合优度(Multiple R-squared):0.3405;
修正的拟合优度(Adjusted R-squared):0.298;
F检验:8.003在10和124DF上,p值:1.169e-08;
各项指标均好于多元线性回归。
回归诊断:
用Bonferroni修正,修正之后,没有拒绝任何一个零假设,这说明没有异常值,通过多重比较确认没有Bonferonni p<0.05的学生化残差;
异常值检验是对每一个观测值的残差项做检验,看是否是异常值。这是一个常规的假设检验,主要的想法是,如果一个观测值是异常值,那么它的残差项将很大(残差项越大表明越偏离我们的线性假设)。由于对每一个观测值都要做一个这样的假设检验,本实施例做了133个检验,所以需要进行多个假设检验(Multiple Testing Procedure,or MTP)的修正。这里我们用Bonferroni修正。修正之后,我们没有拒绝任何一个零假设,这说明没有异常值。
QQ图:QQ图,如图4所示,是用来比较所给数据的残差项的分布与线性假设的理论分布的偏离度。如果线性假设符合,则所有的点应该在45度线附近。从QQ图上可以看出,还是比较符合线性假设的。
强影响点观察:
如表5所示:
强影响点 | 学生化残差 | HAT | Cook距离 |
7 | -3.1135411 | 0.04388522 | 0.037759699 |
15 | -2.3278604 | 0.08500604 | 0.044167257 |
20 | 1.9138571 | 0.73709916 | 0.913656775 |
125 | -0.1068366 | 0.75311932 | 0.003191228 |
Cook距离:Cook距离是线性成分的偏离度与杠杆值的乘积,Cook距离越大,表明偏离线性假设越多或杠杆越大(或两者皆有),Cook检验给出了4个观测值对多元逐步选择线性回归模型影响很大。
影响图,如图5所示,影响图是另一种和Cook距离很类似的鉴别每个观测值对回归模型影响的图。圈越大表明影响越大。影响图标出数的观测值是对回归模型影响大的那几个观测值。从影响图与Cook距离得比较中可以看出,两者给出的4个点是一致的。
非常量误差方差:
分布水平图,如图6所示:
误差项常值检验:这是直接对误差项为常值这个统计假设做假设检验。误差项通过了误差项常值检验。
Spread-Level图:Spread-Level图描绘的是标准残差项的绝对值与拟合值的关系。从图中可以看到,基本误差项均值在水平线附近,而且没有分布变大的趋势。这表明没有异方差。
评估非线性:
绘制成分残差图,如图7所示,从图中可以看出,绝大部分变量至少是单调的,有一部分和线性假设已经很符合了。在所有实际问题中,不可能所有变量都是线性的;
优选的,惩罚回归:将数据指标分为训练集和测试集;
使用公式五,训练岭回归,设置十折交叉验证,包括:
其中:
I表示单位矩阵;
λ表示岭系数;
X′表示属性矩阵,即上述定量数据等因变量属性构成的矩阵;
X′T表示X属性矩阵的转置;
Y表示煤炭单耗列矩阵;
使用公式六进行k折交叉验证;
其中:
CV表示交叉验证误差;
k表示划分原始数据的组数;
MSE表示均方误差;
I表示将所有的均方误差加起来。
绘制岭回归图,如图8所示,绘制岭回归均方误差图,如图9所示。
优选的,将训练集进入岭回归模型进行拟合,使用最优lambda和1折 lambda进行训练,获取训练集最优lambda训练结果和1折lambda训练结果;
再将测试集进入岭回归模型进行测试,获取平均最优lambda测试结果和平均1折lambda测试结果。
如表6所示,表6为最优lambda训练结果:
如表7所示,表7为1折lambda训练结果:
(Intercept) | -0.30896921 |
univalent | 0.06382534 |
Freight | 0.01331168 |
BuyingPrice | 0.26744778 |
CalorificValue | 0.02028054 |
Mt | 0.04896259 |
sulfur | -0.02076066 |
VolatileMatter | -0.21758365 |
ash | -0.06911278 |
FixedCarbon | -0.04973636 |
ST | -0.0298090 |
A | -0.82885479 |
B | -0.08634355 |
C | 0.94549402 |
测试数据进入岭回归模型测试性能:
平均最好lambda 0.4928419;
平均1折lambda 0.4838848;
优选的,根据拉索回归模型,使用公式七,训练拉索回归,设置十折交叉验证,包括:
Flasso=‖Y-X′w‖2 2+λ′‖w‖1--公式七;
其中:
Flasso表示拉索回归的损失函数;
Y表示煤炭单耗列矩阵;
X′表示属性矩阵,即上述定量数据等因变量属性构成的矩阵;
λ′表示自定义系数,分别是1折lambda和最优lambda;
w表示无偏估计系数;
将训练集进入拉索回归模型进行拟合,使用最优lambda和1折lambda 进行训练,获取训练集最优lambda训练结果和1折lambda训练结果;
再将测试集进入拉索回归模型进行测试,获取平均最优lambda测试结果和平均1折lambda测试结果;
绘制拉索回归图,如图10所示,绘制拉索均方误差图,如图11所示。
如表8所示,表8为最优lambda训练结果:
如表9所示,表9为1折lambda训练结果:
(Intercept) | -0.52283195 |
univalent | 0.00127381 |
Freight | |
BuyingPrice | 0.31669355 |
CalorificValue | |
Mt | |
sulfur | |
VolatileMatter | -0.09399514 |
ash | -0.03036382 |
FixedCarbon | |
ST | |
A | -0.56804069 |
B | |
C | 1.27325710 |
测试数据进入拉索回归模型测试性能:
平均最好lambda 0.5140706;
平均1折lambda 0.5069672;
从拉索回归的最优lambda和1折lambda模型比较,可以看出,效应最强的变量是:矿口价、采购价、挥发分、含硫量和灰分,以及使用煤炭的工厂。
优选的,比较岭回归模型和拉索回归模型,选取其中一个模型作为煤耗测评的基础模型,根据其最优lambda训练结果,获取各个试验场所的煤炭单耗测评结果;
具体的,在本实施例中,经过对岭回归和拉索回归的比较,可以发现岭回归模型的效果优于拉索回归,因此在煤耗模型的比较中,最终选择岭回归模型作为煤耗评估预测的基础模型。在其他实施例中,经过对岭回归和拉索回归的比较,若是发现拉索回归模型的效果优于岭回归模型,则选择拉索回归模型作为煤耗评估预测的基础模型,特别地,拉索回归可以简单的选择效应最强的变量及工厂,在需要快速了解主要变量时,可以作为选择;
对四家工厂的单耗结果比较得出结论如下,如表10所示:
Intercept | -0.513017486 | 工厂效果评价分数 |
A | -0.729111600 | -1.242133486 |
B | 0.038338058 | -0.474679428 |
C | 1.254991304 | 0.741973818 |
D | 0 | -0.513017486 |
单耗排名结果分别为:C、B、D、A;即煤耗的单耗控制的最好工厂为C 工厂;其次为B工厂、D工厂和A工厂。
经实地考察复核,该结果真实反映了四间工厂的煤炭单耗水平以及生产管理水平。
本发明可以作为各个陶瓷企业在煤炭单耗的评估综合方法,各企业在管理煤炭成本及煤炭烧成过程中,可依据本评估方法进行综合评价及自我评估测评。
本技术方案的推出有利于研究煤耗成本在行业同等条件下的平均水平;同样的生产环境下的同比水平或环比水平;同一生产环境的波动曲线中的优劣分析。
本方案推出有利于供应链环节寻找最佳的块煤源头或标准;工厂研究最佳的烧煤工艺及操作规程;异常情况处理的标准化流程;匹配基本条件满足的情况下(稳定性、安全性、排放)价格与煤耗之间的最佳成本路径;最后研究改良装备以更大力度降低成本。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
Claims (9)
1.一种煤耗的评估方法,其特征在于:具体步骤如下:
确定测评的各项指标数据,包括定量数据和定性数据,其中,定量数据包括:
与煤炭价格相关的数据指标:矿口价、运费、工厂采购价和煤炭单耗成本;
与煤炭质量相关的数据指标:发热量、全水、固定碳、含硫量、软化温度和灰分;
定性数据包括:四个实验场所;
对各项指标数据进行检查清洗,计算数据中的各项指标值;
对数据进行标准化处理;
建立数据模型,进行模型分析,对数据模型训练和测试,包括:
建立线性回归模型、多元回归模型、多元逐步选择线性回归模型、岭回归模型和拉索回归模型,设置训练集和测试集,分别代入以上模型,以训练集做模型训练,以测试集对模型训练结果进行测试,对上述模型进行假设检验和交叉验证;
对模型进行检验,包括:
使用统计分析对上述模型进行检验,使用常态化残差和学生化残差做模型评估检测;
根据模型检验,在岭回归模型和拉索回归模型中确定基础模型,根据基础模型分析判断评价结果。
3.根据权利要求2所述一种煤耗的评估方法,其特征在于:
将经过标准化处理的数据指标,以煤炭单耗成本为因变量,其他定量数据为自变量,绘制散点图矩阵,根据散点图矩阵确定多个变量之间的主要相关性;
根据数据指标,绘制直方图,查看因变量的分布情况,确定因变量的值的选取;
根据线性回归模型,通过公式二获取煤炭单耗成本与工厂采购价的关系;
Y=β0+β1X1‘+ε--公式二;
其中:
Y表示煤炭单耗列矩阵;
β0表示线性方程截距;
X1‘表示煤炭采购价格的列矩阵;
βi‘表示线性参数;
ε表示未观测的随机成份;
根据公式三获取煤炭单耗成本与工厂采购价的相关系数;
其中:
Y表示煤炭单耗列矩阵;
X1‘表示煤炭采购价格的列矩阵;
xi表示煤炭采购价格;
yi表示煤炭单耗成本;
Cor(X,Y)表示煤炭单耗成本与煤炭采购价格的相关系数;
i=1,2,…,n,表示n个煤炭采购价格数据或煤炭单耗成本数据中的其中一个。
4.根据权利要求3所述一种煤耗的评估方法,其特征在于:
根据多元回归模型,使用公式四做多元线性回归;
Y=β0+β1X1+β2X2+…+β10X10+ε--公式四;
其中:
Y表示煤炭单耗列矩阵;
β0表示线性方程截距;
β1表示运费估计系数;
X1表示运费列矩阵;
β2表示矿口价格估计系数;
X2表示矿口价格列矩阵;
β3表示发热量估计系数;
X3表示发热量矩阵;
β4表示全水分Mt估计系数;
X4表示全水分Mt矩阵;
β5表示含硫量估计系数;
X5表示含硫量矩阵;
β6表示挥发分估计系数;
X6表示挥发分矩阵;
β7表示固定碳估计系数;
X7表示固定碳矩阵;
β8表示灰熔融性软化温度估计系数;
X8表示灰熔融性软化温度矩阵;
β9表示工厂采购价估计系数;
X9表示工厂采购价矩阵;
β10表示灰分估计系数;
X10表示灰分矩阵;
ε表示未观测的随机成份。
5.根据权利要求4所述一种煤耗的评估方法,其特征在于:
根据多元逐步选择线性回归模型,做多元线性回归的变量筛选,包括:
对多个变量进行逐步筛选,根据每个变量与多元逐步选择线性回归模型的关联度,筛选出多个表现显著的变量。
7.根据权利要求6所述一种煤耗的评估方法,其特征在于:
将训练集进入岭回归模型进行拟合,使用最优lambda和1折lambda进行训练,获取训练集最优lambda训练结果和1折lambda训练结果;
再将测试集进入岭回归模型进行测试,获取平均最优lambda测试结果和平均1折lambda测试结果。
8.根据权利要求7所述一种煤耗的评估方法,其特征在于:
根据拉索回归模型,使用公式七,训练拉索回归,设置十折交叉验证,包括:
Flasso=‖Y-X′w‖2 2+λ′‖w‖1--公式七;
其中:
Flasso表示拉索回归的损失函数;
Y表示煤炭单耗列矩阵;
X′表示属性矩阵,即上述定量数据等因变量属性构成的矩阵;
λ′表示自定义系数,分别是1折lambda和最优lambda;
w表示无偏估计系数;
将训练集进入拉索回归模型进行拟合,使用最优lambda和1折lambda进行训练,获取训练集最优lambda训练结果和1折lambda训练结果;
再将测试集进入拉索回归模型进行测试,获取平均最优lambda测试结果和平均1折lambda测试结果。
9.根据权利要求8所述一种煤耗的评估方法,其特征在于:
比较岭回归模型和拉索回归模型,选取其中一个模型作为煤耗测评的基础模型,根据其最优lambda训练结果,获取各个实验场所的煤炭单耗测评结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011118959.7A CN112258019A (zh) | 2020-10-19 | 2020-10-19 | 一种煤耗的评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011118959.7A CN112258019A (zh) | 2020-10-19 | 2020-10-19 | 一种煤耗的评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112258019A true CN112258019A (zh) | 2021-01-22 |
Family
ID=74244763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011118959.7A Pending CN112258019A (zh) | 2020-10-19 | 2020-10-19 | 一种煤耗的评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112258019A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949131A (zh) * | 2021-03-05 | 2021-06-11 | 哈尔滨工业大学 | 连续桥梁集群损伤诊断的概率损伤定位向量法 |
CN113506125A (zh) * | 2021-06-21 | 2021-10-15 | 北京琥珀创想科技有限公司 | 用户价值的预测方法、装置以及存储介质 |
CN113808724A (zh) * | 2021-11-17 | 2021-12-17 | 北京因数健康科技有限公司 | 数据分析方法及装置、存储介质及电子终端 |
CN117494862A (zh) * | 2023-08-09 | 2024-02-02 | 长江勘测规划设计研究有限责任公司 | 一种基于假设检验的有限样本下数据驱动径流预报模型优选方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279573A (zh) * | 2015-09-19 | 2016-01-27 | 东北电力大学 | 一种火电厂煤耗率经济性分析方法 |
KR101855248B1 (ko) * | 2017-04-20 | 2018-05-08 | (주)에코센스 | 트런케티드 선형회귀모델을 이용한 에너지절감 성과평가방법 |
CN109766517A (zh) * | 2018-11-29 | 2019-05-17 | 国网江苏省电力有限公司盐城供电分公司 | 一种用于变电站能效评估的能耗基准修正方法 |
CN110378064A (zh) * | 2019-07-29 | 2019-10-25 | 安徽工业大学 | 一种预测炼铁高炉炉芯死料柱温度的方法 |
CN110458323A (zh) * | 2019-06-27 | 2019-11-15 | 广东工业大学 | 一种基于快速序列浮动特征选择的短期住宅负荷预测方法 |
CN110716512A (zh) * | 2019-09-02 | 2020-01-21 | 华电电力科学研究院有限公司 | 一种基于燃煤电站运行数据的环保装备性能预测方法 |
US20200286189A1 (en) * | 2018-03-22 | 2020-09-10 | Xi'an Jiaotong University | Analysis method of coal consumption of thermal power units during peak shaving transient process |
-
2020
- 2020-10-19 CN CN202011118959.7A patent/CN112258019A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105279573A (zh) * | 2015-09-19 | 2016-01-27 | 东北电力大学 | 一种火电厂煤耗率经济性分析方法 |
KR101855248B1 (ko) * | 2017-04-20 | 2018-05-08 | (주)에코센스 | 트런케티드 선형회귀모델을 이용한 에너지절감 성과평가방법 |
US20200286189A1 (en) * | 2018-03-22 | 2020-09-10 | Xi'an Jiaotong University | Analysis method of coal consumption of thermal power units during peak shaving transient process |
CN109766517A (zh) * | 2018-11-29 | 2019-05-17 | 国网江苏省电力有限公司盐城供电分公司 | 一种用于变电站能效评估的能耗基准修正方法 |
CN110458323A (zh) * | 2019-06-27 | 2019-11-15 | 广东工业大学 | 一种基于快速序列浮动特征选择的短期住宅负荷预测方法 |
CN110378064A (zh) * | 2019-07-29 | 2019-10-25 | 安徽工业大学 | 一种预测炼铁高炉炉芯死料柱温度的方法 |
CN110716512A (zh) * | 2019-09-02 | 2020-01-21 | 华电电力科学研究院有限公司 | 一种基于燃煤电站运行数据的环保装备性能预测方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949131A (zh) * | 2021-03-05 | 2021-06-11 | 哈尔滨工业大学 | 连续桥梁集群损伤诊断的概率损伤定位向量法 |
CN113506125A (zh) * | 2021-06-21 | 2021-10-15 | 北京琥珀创想科技有限公司 | 用户价值的预测方法、装置以及存储介质 |
CN113506125B (zh) * | 2021-06-21 | 2024-08-02 | 北京琥珀创想科技有限公司 | 用户价值的预测方法、装置以及存储介质 |
CN113808724A (zh) * | 2021-11-17 | 2021-12-17 | 北京因数健康科技有限公司 | 数据分析方法及装置、存储介质及电子终端 |
CN117494862A (zh) * | 2023-08-09 | 2024-02-02 | 长江勘测规划设计研究有限责任公司 | 一种基于假设检验的有限样本下数据驱动径流预报模型优选方法 |
CN117494862B (zh) * | 2023-08-09 | 2024-05-28 | 长江勘测规划设计研究有限责任公司 | 一种基于假设检验的有限样本下数据驱动径流预报模型优选方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112258019A (zh) | 一种煤耗的评估方法 | |
Ellison et al. | Quantifying uncertainty in analytical measurement | |
Ríos et al. | Quality assurance of qualitative analysis in the framework of the European project’MEQUALAN’ | |
CN109540837B (zh) | 近红外快速检测苎麻叶片木质纤维素含量的方法 | |
CN112521955B (zh) | 一种焦饼中心温度检测方法及系统 | |
Williams | Application of chemometrics to prediction of some wheat quality factors by near‐infrared spectroscopy | |
CN111667156A (zh) | 一种多点生产的卷烟物理质量一致性评价的方法 | |
Dos Santos et al. | The use of ANOVA-PCA and DD-SIMCA in the development of corn flour laboratory reference materials | |
CN113834757A (zh) | 一种对蚝油原料的耐高温淀粉酶微量残留的快速检测方法 | |
CN111931425A (zh) | 一种基于rf算法的热轧q355b钢种的性能预测系统 | |
CN112903928B (zh) | 基于改进层次分析的室内空气质量评价方法 | |
CN116679029A (zh) | 一种煤炭特征指标在线检测系统 | |
CN114462873B (zh) | 一种配电网可靠性评估及其影响因素分析方法 | |
CN115619022A (zh) | 一种基于支持向量机的焦炭质量预测方法及应用 | |
CN115204453A (zh) | 一种碳排放预测方法、设备及存储介质 | |
CN113960092A (zh) | 一种煤炭灰分快速检测方法 | |
CN105866065A (zh) | 一种乌洛托品-醋酸溶液中乌洛托品含量分析方法 | |
CN114047312A (zh) | 一种基于数据处理的煤质在线分析方法 | |
CN109374593B (zh) | 一种检测混煤煤质及配比的方法及系统 | |
CN107133718B (zh) | 固体类大宗矿产资源商品的抽样制样方法 | |
Christensen et al. | Method evaluation, quality control, and external quality assurance systems of analytical procedures | |
CN105181640A (zh) | 一种利用近红外光谱技术快速测定制浆材水分含量的方法 | |
CN118190939B (zh) | 一种既有建筑木构件耐火性预测方法及系统 | |
CN116859845B (zh) | 一种热电环保的生产节点管理方法及系统 | |
Saiepour et al. | Development and assessment of predictive emission monitoring systems (PEMS) models in the steel industry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |