CN109710888A - 一种基于惩罚回归的天然气管道损坏预测方法及装置 - Google Patents

一种基于惩罚回归的天然气管道损坏预测方法及装置 Download PDF

Info

Publication number
CN109710888A
CN109710888A CN201811367080.9A CN201811367080A CN109710888A CN 109710888 A CN109710888 A CN 109710888A CN 201811367080 A CN201811367080 A CN 201811367080A CN 109710888 A CN109710888 A CN 109710888A
Authority
CN
China
Prior art keywords
natural gas
model
value
gas line
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811367080.9A
Other languages
English (en)
Other versions
CN109710888B (zh
Inventor
姜春涛
杨志鹄
黄钢忠
于辉
黄颖欣
侯菁菁
冯樱
吴志炜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Dayan Data Technology Co ltd
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN201811367080.9A priority Critical patent/CN109710888B/zh
Publication of CN109710888A publication Critical patent/CN109710888A/zh
Application granted granted Critical
Publication of CN109710888B publication Critical patent/CN109710888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开公开了一种基于惩罚回归的天然气管道损坏预测方法及装置,针对各环境变量对天然气管道的影响进行天然气管道使用期限的预测,使用改进的前向逐步回归模型和最小角度模型,归一化模型处理和十折交叉验证模型等多模型相结合,将前向逐步回归模型中的步长由均方根误差改为了校正确定系数值,以增加算法的准确性和可行性;在选取相关属性时本公开用到的性能评价指数为校正值,可以提高选取相关属性的准确度,提高了最后天然气管道使用期限预测模型训练过程的准确度,因此,预计本公开最后的预测结果的准确度至少可达95%。

Description

一种基于惩罚回归的天然气管道损坏预测方法及装置
技术领域
本公开涉及人工智能技术领域,具体涉及一种基于惩罚回归的天然气管道损坏预测方法及装置。
背景技术
自天然气能源开发以来,人们一直用管道进行运输,利用管道运输天然气具有高效、快捷、相对安全等优势。但是由于天然气自身具有易燃、易爆、有毒等性质,所以任何运输方式都不敢说能过完全保证其输气安全,管道运输也不例外。并且,管道运输多半采用高压保证长距离运输,天然气是居民日常使用的能源,因此要持续输送,居民住宅、餐饮业遍布城市各个位置,所以天然气管道错综复杂,不同的城市面对的环境因素也是具有差异的,很多因素对于天然气运输都有一定的影响,一旦管道发生损坏和泄漏,将会造成重大的安全事故,严重损害居民生命安全和经济发展。
在现有的技术中,有一些人是通过比较管道裂纹尖端区域单位面积上的损伤断裂吸收能与所述损伤断裂吸收能临界值以作为管道是否开裂的依据,若实际损伤断裂吸收能大于等于损伤断裂吸收能临界值,则管道开裂,否则管道未开裂。然后从有限元模型中计算得到裂纹扩展速度和气体减压波速度,通过比较裂纹扩展速度与气体减压波速度作为出现裂纹之后能否止裂的依据,若裂纹扩展速度小于等于气体减压波速度,则管道裂纹能止裂,否则管道裂纹不能止裂。该发明专利只能预测当下天然气管道是否开裂,如若开裂,是否能够止裂。
还有一些方法是利用小生境遗传算法的灰色预测模型来预测天然气管道的腐蚀速率,对原始数据进行处理,分别建立平均腐蚀速率、平均腐蚀深度、最大腐蚀速率、最大腐蚀深度等指标的灰色动态模型,并对模型进行预测,最后用预测值与实际值作比较,发现该模型预测的各项指标的平均相对误差都比较小,能满足实际预测需求。
现有的技术只能对天然气管道的材质进行使用年限的预测,不能预测环境对管道的影响,但是在现实生活中环境对管道造成的影响又是不可忽视的,天然气管道所处的环境有可能使得天然气管道提前损坏、破裂等,不能再使用,如果不能即使对已经损坏的天然气管道进行修补或者更换,可能会对居民的人生和财产造成不可估量的损害,因此必须对环境对天然气管道的影响进行预测,为求做到尽早发现,尽早更换。
发明内容
本公开提供一种基于惩罚回归的天然气管道损坏预测方法及装置,针对各环境变量对天然气管道的影响进行天然气管道使用期限的预测,其中环境变量包括:管道所承受的压力、土壤温度、土壤湿度、土壤pH值(酸碱度)、气体温度、气体组成的成分比例(甲烷、乙烷、丙烷、异丁烷、正丁烷、戊烷、氮气)、气体压力,本公开是根据天然气管道所处的环境作为属性,使用这些属性来预测天然气管道在该环境下的使用期限,以求得环境对天然气管道损坏的影响;使用了改进的前向逐步回归模型和最小角度模型,其中还有归一化模型处理和十折交叉验证模型等多模型相结合,本公开中将前向逐步回归模型中的步长(性能评价指标)由均方根误差改为了校正确定系数(R2)值,以增加算法的准确性和可行性;结果是精确度能精确到月份,这样可以避免资源的浪费。
为了实现上述目的,根据本公开的一方面,提供一种基于惩罚回归的天然气管道损坏预测方法,所述方法包括以下步骤:
步骤1,对天然气管道数据进行采集;
步骤2,通过前向逐步回归模型对天然气管道数据进行数据预处理得到模型训练的各个属性值;
步骤3,构建天然气管道损坏预测模型;
步骤4,将属性值输入到天然气管道损坏预测模型得出结果。
进一步地,在步骤1中,所述天然气管道数据包括,天然气管道所承受的压力、土壤温度、土壤湿度、土壤pH值,即酸碱度、气体温度、气体组成的成分比例,气体组成包括甲烷、乙烷、丙烷、异丁烷、正丁烷、戊烷、氮气、气体压力以及该管道的使用期限,即使用多久管道损坏,以月为单位,通过传感器等收集以上数据并导出到Excel表中,作为模型训练的数据集。以上属性均由现有技术的研究中得来,如果在本发明的研究中有发现更合适的属性亦可加进来一起研究,且在本发明的步骤2中将会做数据预处理,将从以上属性中挑选出与目标属性相关性最大的10个属性来进行之后的研究。
进一步地,在步骤2中,通过前向逐步回归模型对天然气管道数据进行数据预处理的方法为,所述前向逐步回归模型主要是用于特征选取的,前向逐步回归模型为通过遍历属性的每一列子集,选择使模型效果最好的那一列属性,接着寻找与其组合效果最好的第二列属性,而不是遍历所有的两列子集,变量由少到多,每次增加一个,直至没有可引入的变量为止,每次遍历时,子集都包含上一次遍历得到的最优子集,最优子集为从全部自变量所有可能的自变量组合的子集回归方程中挑选最优者。首先把所有可能包含1个、2个、…、直至全部m个自变量的子集回归方程都拟合。m个自变量会拟合2m-1个子集回归方程,如m=3,会拟合23-1=7个子集回归方程(其中包含1个自变量的3个,包含2个自变量的3个,包含3个自变量的1个),然后用回归方程的统计量作准则从中挑选最优者,这样,每次遍历都会选择一个新的属性添加到特征集合中,直至特征集合中特征个数不能再增加;
步骤2.1,定义一个空的集合命名为属性集,该属性集是用于存放被选出来的属性的;
步骤2.2,输入天然气管道数据作为测试集,对天然气管道数据的每个属性使用普通的最小二乘法进行拟合回归,并对测试集上的数据进行预测得到使用期限预测结果,用回归得到的预测结果和预留测试集的结果的误差作比较;通过确定系数R2值来替换均方根误差,R2值是相对原始数据平均值而展开的误差分析即点对全,R2值用于消除原始数据离散程度的影响,为了求校正R2值,首先求出最小二乘法拟合回归的结果与原始数据均值之差的平方和,以下称SSR和原始数据的结果与原始数据均值之差的平方和,以下称SST,其中SSR等于每一个回归结果与原始数据均值的差的平方的求和,SST等于每一个原始数据与原始数据均值的差的平方的求和,然后确定系数R2的值等于SSR与SST的比值,然后校正R2值等于一减去一减去R2与n减去一之后与n减p减一的比值,即:校正R2值=1-((1-R2)(n-1)/(n-p-1)),其中n为样本数量,p为属性数量,从中选出最大的校正R2值并保存该校正R2值;
步骤2.3,将剩下的属性都与选出的属性结合,使用普通的最小二乘法进行拟合模型,将拟合的结果和预留的测试集的结果作比较,求出每个的校正R2值,然后选取这些属性中校正R2值最大的加入属性集中,并保存对应的校正R2值;
步骤2.4,重复步骤2.3,向属性集中添加属性,直到所有属性都加入属性集。
步骤2.5,比较所有属性个数对应的最大的校正R2值,选取其中最大的校正R2值对应的属性个数作为最后模型训练的属性个数,属性集中前面对应个数的那几个属性即为最后模型训练的各个属性值。
进一步地,在步骤3中,构建天然气管道损坏预测模型的方法包括以下步骤,
步骤3.1,输入模型训练的各个属性值以及使用期限的标签,将这些属性和标签都转换为均值为0,标准差为1的分布并进行归一化的处理,将属性值和标签值转换为同等尺度,方便地绘制以及充分填充坐标;
步骤3.2,对已经进行归一化处理后的数据使用LARS,即最小角度回归模型,进行训练,通过最小角度回归模型的训练,生成多个不同复杂度的模型;
步骤3.3,通过在最小角度回归模型中加入十折交叉验证算法判断每个模型的错误程度,从而挑选错误最小的模型作为最佳模型;
步骤3.4,初始化一个错误列表,该错误列表包含最小角度回归算法中每一步迭代的错误,算法会对所有十折交叉验证的每折错误进行累加,然后使用一个随机函数来定义训练集和测试集,定义好训练集和测试集之后,开始最小角度回归模型的迭代了,接着对每个错误列表进行平方去平均,即求出了每一个模型的均方误差;
步骤3.5,选择最小均方误差对应的那个模型作为最佳模型,此模型为最小角度回归模型输出的结果,即为预测天然气管道使用期限的模型。
进一步地,在步骤4中,将属性值输入到天然气管道损坏预测模型得出结果的方法为,将属性值输入到该模型中,即可输出在该属性下,天然气管道的使用期限是多少,得到天然气管道的使用期限之后,可以在天然气管道损坏泄漏之前将其更换。
本公开还提供了一种基于惩罚回归的天然气管道损坏预测装置,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
数据集采集单元,用于对天然气管道数据进行采集;
数据预处理单元,用于通过前向逐步回归模型对天然气管道数据进行数据预处理得到模型训练的各个属性值;
预测模型构建单元,用于构建天然气管道损坏预测模型;
模型输出单元,用于将属性值输入到天然气管道损坏预测模型得出结果。
本公开的有益效果为:本公开提供一种基于惩罚回归的天然气管道损坏预测方法及装置,可以预测环境对天然气管道损坏的影响,而不仅仅是对天然气管道材质使用期限的预测,天然气管道在不同的环境中有不同的使用期限,这些都可以通过本公开所求得的模型来求出,而且,现有技术只能预测到年份,一年的时间很长,如果过早更换天然气管道,会浪费资源,而且更换一次天然气管道需要付出的代价也不低,如果过晚更换天然气管道,则会造成管道泄漏等危害,而本公开中所用到的使用期限的单位是月份,只需知道使用期限的月份,即可提前一个月去更换天然气管道,合理利用资源,不浪费,也不对居民、社会造成不必要的危害。由于在选取相关属性时本公开用到的性能评价指数为校正的R2值,这样可以提高选取相关属性的准确度,从而提高了最后天然气管道使用期限预测模型训练过程的准确度,因此,预计本公开最后的预测结果的准确度至少可达95%。假设有一间天然气管道供应铺设公司有两批管道已经使用比较久了,需要更换,如果没有本公开,该公司则需要将所有管道都进行检查之后才能决定先更换哪一批,通过本公开提供的技术,可以先预测出哪批管道先损坏,以决定先去更换哪一批管道,这样可以减少工作量和工作时间。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
图1所示为一种基于惩罚回归的天然气管道损坏预测方法的流程图;
图2所示为一种基于惩罚回归的天然气管道损坏预测装置图。
具体实施方式
以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如图1所示为根据本公开的一种基于惩罚回归的天然气管道损坏预测方法的流程图,下面结合图1来阐述根据本公开的实施方式的一种基于惩罚回归的天然气管道损坏预测方法。
本公开提出一种基于惩罚回归的天然气管道损坏预测方法,具体包括以下步骤:
步骤1,数据采集;本发明所需的数据有:管道所承受的压力、土壤温度、土壤湿度、土壤pH值(酸碱度)、气体温度、气体组成的成分比例(甲烷、乙烷、丙烷、异丁烷、正丁烷、戊烷、氮气)、气体压力以及该管道的使用期限(即使用多久管道损坏,以月为单位)。通过传感器等收集以上数据并导出到Excel表中,作为模型训练的数据集。以上属性均由现有技术的研究中得来,如果在本发明的研究中有发现更合适的属性亦可加进来一起研究,且在本发明的步骤2中将会做数据预处理,将从以上属性中挑选出与目标属性相关性最大的十个属性来进行之后的研究。
步骤2,前向逐步回归模型进行数据预处理;该步骤2的前向逐步回归模型主要是用于特征选取的;首先,定义一个空的集合命名为属性集,该属性集是用于存放被选出来的属性的。
然后,输入步骤1获取到的数据,对每个属性使用普通的最小二乘法进行拟合回归,并对测试集上的数据进行预测得到使用期限预测结果,用回归得到的预测结果结果和预留测试集的结果作比较,查看误差,比较之后会发现数据在训练集上预测拟合效果很好,但是在测试集上效果较差,比不上训练集上的效果。
由于最小二乘法与其他现代的函数逼近算法都存在过拟合这一共性,而过拟合的根源在于原数据中的属性列太多,这时我们就需要引进算法来合理的去掉一些对我们结果不会有太大影响的列,常用的属性列选择的算法有蛮力的最佳子集选择算法和前向逐步回归算法。不过由于最佳子集选择算法需要大量计算,算法的时间复杂度为O(2n),属于复杂度的最高级别,因此我们选用前向逐步回归算法,以减少算法的时间。
步长又称为性能评价指标,用于比较判断哪个属性与目标属性关系更好,以选出与目标属性即天然气管道使用期限的相关性最高的几个属性。因为前向逐步回归算法中的步长选用的是均方根误差(RMSE),不过均方根误差至少基于预测值和原始值之间的误差即点对点,使用到的参数较少,精确度还不够高,因为是需要选出与目标属性关系最大的几个属性,所以期望能再提高精确度,因此我们需要用确定系数R2值来替换均方根误差,R2值是相对原始数据平均值而展开的误差分析即点对全,R2值可以消除原始数据离散程度的影响,不过R2值会随着数据集样本的增大而增大,所以,通过校正决定系数(adjusted R2),校正决定系数可以消除样本数量和特征数量的影响。
为了求校正R2值,首先我们需要先求出最小二乘法拟合回归的结果与原始数据均值之差的平方和(SSR)和原始数据的结果与原始数据均值之差的平方和(SST),其中SSR等于每一个回归结果与原始数据均值的差的平方的求和,SST等于每一个原始数据与原始数据均值的差的平方的求和,然后确定系数R2的值等于SSR与SST的比值,然后校正R2值等于一减去一减去R2与n减去一之后与n减p减一的比值,即:校正R2值=1-((1-R2)(n-1)/(n-p-1)),其中n为样本数量,p为属性数量,从中选出最大的校正R2值并保存该校正R2值。
接下来,将剩下的属性都与选出的属性结合,使用普通的最小二乘法进行拟合模型,将拟合的结果和预留的测试集的结果作比较,求出每个的校正R2值,然后选取这些属性中校正R2值最大的加入属性集中,并保存对应的校正R2值。
然后,重复上述步骤,向属性集中添加属性,直到所有属性都加入属性集。
最后,比较所有属性个数对应的最大的校正R2值,选取其中最大的校正R2值对应的属性个数作为最后模型训练的属性个数,属性集中前面对应个数的那几个属性即为最后模型训练的各个属性。
步骤3,构建模型预测天然气管道使用期限;该步是通过对选定的属性进行训练,得出一个可以用于预测天然气管道使用期限的模型;首先,对步骤2选出的属性以及使用期限的标签,把这些属性和标签都转换为均值为0,标准差为1的分布,做一个归一化的处理,将属性值和标签值转换为同等尺度,从而可以方便地绘制以及充分填充坐标。
然后,对已经进行归一化处理后的数据使用LARS(最小角度回归)模型进行训练,通过最小角度回归模型的训练,生成数百个不同复杂度的模型,之所以选择最小角度回归算法是因为该算法非常接近于套索以及前向逐步回归算法,最小角度回归算法很容易理解并且实现起来相对紧凑,而且最小角度回归算法相对前向逐步回归算法的优点是该算法在引入新属性时只是部分引入,引入属性过程并非不可逆。
接着,为了从这数百个不同复杂度的模型中挑选出最佳模型,可以通过在最小角度回归模型中加入十折交叉验证算法来判断每个模型的错误程度,从而挑选错误最小的模型作为最佳模型,先初始化一个错误列表,该错误列表包含最小角度回归算法中每一步迭代的错误,算法会对所有十折交叉验证的每折错误进行累加,然后使用一个随机函数来定义训练集和测试集,定义好训练集和测试集之后就可以开始最小角度回归模型的迭代了,接着对每个错误列表进行平方去平均,即求每一个模型的均方误差。
最后,最小均方误差对应的那个模型即为最佳模型,这个模型就是最小角度回归模型输出的结果,也将作为预测天然气管道使用期限的模型。
步骤4,得出结果;通过步骤3,得到了一个可以用于预测天然气管道使用期限的模型,我们只需要将属性值输入到该模型中,即可输出在该属性下,天然气管道的使用期限是多少,得到天然气管道的使用期限之后,可以在天然气管道损坏泄漏之前将其更换。
本公开的实施例提供的一种基于惩罚回归的天然气管道损坏预测装置,如图2所示为本公开的一种基于惩罚回归的天然气管道损坏预测装置图,该实施例的一种基于惩罚回归的天然气管道损坏预测装置包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种基于惩罚回归的天然气管道损坏预测装置实施例中的步骤。
所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
数据集采集单元,用于对天然气管道数据进行采集;
数据预处理单元,用于通过前向逐步回归模型对天然气管道数据进行数据预处理得到模型训练的各个属性值;
预测模型构建单元,用于构建天然气管道损坏预测模型;
模型输出单元,用于将属性值输入到天然气管道损坏预测模型得出结果。
所述一种基于惩罚回归的天然气管道损坏预测装置可以运行于桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备中。所述一种基于惩罚回归的天然气管道损坏预测装置,可运行的装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述例子仅仅是一种基于惩罚回归的天然气管道损坏预测装置的示例,并不构成对一种基于惩罚回归的天然气管道损坏预测装置的限定,可以包括比例子更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述一种基于惩罚回归的天然气管道损坏预测装置还可以包括输入输出设备、网络接入设备、总线等。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述一种基于惩罚回归的天然气管道损坏预测装置运行装置的控制中心,利用各种接口和线路连接整个一种基于惩罚回归的天然气管道损坏预测装置可运行装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述一种基于惩罚回归的天然气管道损坏预测装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
尽管本公开的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本公开的预定范围。此外,上文以发明人可预见的实施例对本公开进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本公开的非实质性改动仍可代表本公开的等效改动。

Claims (7)

1.一种基于惩罚回归的天然气管道损坏预测方法,其特征在于,所述方法包括以下步骤:
步骤1,对天然气管道数据进行采集;
步骤2,通过前向逐步回归模型对天然气管道数据进行数据预处理得到模型训练的各个属性值;
步骤3,构建天然气管道损坏预测模型;
步骤4,将属性值输入到天然气管道损坏预测模型得出结果。
2.根据权利要求1所述的一种基于惩罚回归的天然气管道损坏预测方法,其特征在于,在步骤1中,天然气管道数据包括,天然气管道所承受的压力、土壤温度、土壤湿度、土壤pH值,即酸碱度、气体温度、气体组成的成分比例,气体组成包括甲烷、乙烷、丙烷、异丁烷、正丁烷、戊烷、氮气、气体压力以及该管道的使用期限,即使用多久管道损坏,以月为单位,通过传感器等收集以上数据并导出到Excel表中。
3.根据权利要求1所述的一种基于惩罚回归的天然气管道损坏预测方法,其特征在于,所述前向逐步回归模型主要是用于特征选取的,前向逐步回归模型为通过遍历属性的每一列子集,变量由少到多,每次增加一个,直至没有可引入的变量为止,每次遍历时子集都包含上一次遍历得到的最优子集,直至特征集合中特征个数不能再增加。
4.根据权利要求1所述的一种基于惩罚回归的天然气管道损坏预测方法,其特征在于,在步骤2中,通过前向逐步回归模型对天然气管道数据进行数据预处理的方法为,
步骤2.1,定义一个空的集合命名为属性集,该属性集是用于存放被选出来的属性的;
步骤2.2,输入天然气管道数据作为测试集,对天然气管道数据的每个属性使用普通的最小二乘法进行拟合回归,并对测试集上的数据进行预测得到使用期限预测结果,用回归得到的预测结果和预留测试集的结果的误差作比较;通过确定系数R2值来替换均方根误差,R2值是相对原始数据平均值而展开的误差分析即点对全,R2值用于消除原始数据离散程度的影响,为了求校正R2值,首先求出最小二乘法拟合回归的结果与原始数据均值之差的平方和,以下称SSR和原始数据的结果与原始数据均值之差的平方和,以下称SST,其中SSR等于每一个回归结果与原始数据均值的差的平方的求和,SST等于每一个原始数据与原始数据均值的差的平方的求和,然后确定系数R2的值等于SSR与SST的比值,则校正
R2值=1-((1-R2)(n-1)/(n-p-1)),其中n为样本数量,p为属性数量,从中选出最大的校正R2值并保存该校正R2值;
步骤2.3,将剩下的属性都与选出的属性结合,使用普通的最小二乘法进行拟合模型,将拟合的结果和预留的测试集的结果作比较,求出每个的校正R2值,然后选取这些属性中校正R2值最大的加入属性集中,并保存对应的校正R2值;
步骤2.4,重复步骤2.3,向属性集中添加属性,直到所有属性都加入属性集;
步骤2.5,比较所有属性个数对应的最大的校正R2值,选取其中最大的校正R2值对应的属性个数作为最后模型训练的属性个数,属性集中前面对应个数的那几个属性即为最后模型训练的各个属性值。
5.根据权利要求1所述的一种基于惩罚回归的天然气管道损坏预测方法,其特征在于,在步骤3中,构建天然气管道损坏预测模型的方法包括以下步骤,
步骤3.1,输入模型训练的各个属性值以及使用期限的标签,将这些属性和标签都转换为均值为0,标准差为1的分布并进行归一化的处理,将属性值和标签值转换为同等尺度,方便地绘制以及充分填充坐标;
步骤3.2,对已经进行归一化处理后的数据使用LARS,即最小角度回归模型,进行训练,通过最小角度回归模型的训练,生成多个不同复杂度的模型;
步骤3.3,通过在最小角度回归模型中加入十折交叉验证算法判断每个模型的错误程度,从而挑选错误最小的模型作为最佳模型;
步骤3.4,初始化一个错误列表,该错误列表包含最小角度回归算法中每一步迭代的错误,算法会对所有十折交叉验证的每折错误进行累加,然后使用一个随机函数来定义训练集和测试集,定义好训练集和测试集之后,开始最小角度回归模型的迭代了,接着对每个错误列表进行平方去平均,即求出了每一个模型的均方误差;
步骤3.5,选择最小均方误差对应的那个模型作为最佳模型,此模型为最小角度回归模型输出的结果,即为预测天然气管道使用期限的模型。
6.根据权利要求1所述的一种基于惩罚回归的天然气管道损坏预测方法,其特征在于,在步骤4中,将属性值输入到天然气管道损坏预测模型得出结果的方法为,将属性值输入到该模型中,即可输出在该属性下天然气管道的使用期限。
7.一种基于惩罚回归的天然气管道损坏预测装置,其特征在于,所述装置包括:存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序运行在以下装置的单元中:
数据集采集单元,用于对天然气管道数据进行采集;
数据预处理单元,用于通过前向逐步回归模型对天然气管道数据进行数据预处理得到模型训练的各个属性值;
预测模型构建单元,用于构建天然气管道损坏预测模型;
模型输出单元,用于将属性值输入到天然气管道损坏预测模型得出结果。
CN201811367080.9A 2018-11-16 2018-11-16 一种基于惩罚回归的天然气管道损坏预测方法及装置 Active CN109710888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811367080.9A CN109710888B (zh) 2018-11-16 2018-11-16 一种基于惩罚回归的天然气管道损坏预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811367080.9A CN109710888B (zh) 2018-11-16 2018-11-16 一种基于惩罚回归的天然气管道损坏预测方法及装置

Publications (2)

Publication Number Publication Date
CN109710888A true CN109710888A (zh) 2019-05-03
CN109710888B CN109710888B (zh) 2023-04-18

Family

ID=66254909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811367080.9A Active CN109710888B (zh) 2018-11-16 2018-11-16 一种基于惩罚回归的天然气管道损坏预测方法及装置

Country Status (1)

Country Link
CN (1) CN109710888B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688711A (zh) * 2019-09-30 2020-01-14 哈尔滨工程大学 一种基于遗传算法的船舶机舱管路优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009046197A1 (en) * 2007-10-05 2009-04-09 Fisher-Rosemount Systems, Inc. Automatic determination of the order of a polynomial regression model applied to abnormal situation prevention in a process plant
CN101915728A (zh) * 2010-07-27 2010-12-15 沈阳建筑大学 埋地金属给水管道剩余寿命预测的测试方法
CN108119761A (zh) * 2017-12-14 2018-06-05 中国石油天然气股份有限公司 一种气液两相流下天然气管道腐蚀程度预测方法
CN108536926A (zh) * 2018-03-21 2018-09-14 西安建筑科技大学 基于改进自适应gev分布的腐蚀油气管道剩余寿命分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009046197A1 (en) * 2007-10-05 2009-04-09 Fisher-Rosemount Systems, Inc. Automatic determination of the order of a polynomial regression model applied to abnormal situation prevention in a process plant
CN101915728A (zh) * 2010-07-27 2010-12-15 沈阳建筑大学 埋地金属给水管道剩余寿命预测的测试方法
CN108119761A (zh) * 2017-12-14 2018-06-05 中国石油天然气股份有限公司 一种气液两相流下天然气管道腐蚀程度预测方法
CN108536926A (zh) * 2018-03-21 2018-09-14 西安建筑科技大学 基于改进自适应gev分布的腐蚀油气管道剩余寿命分析方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110688711A (zh) * 2019-09-30 2020-01-14 哈尔滨工程大学 一种基于遗传算法的船舶机舱管路优化方法

Also Published As

Publication number Publication date
CN109710888B (zh) 2023-04-18

Similar Documents

Publication Publication Date Title
Yi et al. Environmental concerns in the United States: Can renewable energy, fossil fuel energy, and natural resources depletion help?
Thöns On the value of monitoring information for the structural integrity and risk management
Nam et al. Allometric equations for aboveground and belowground biomass estimations in an evergreen forest in Vietnam
Filippi et al. Representation and evaluation of wildfire propagation simulations
Pan et al. The impact of variation in scale on the behavior of a cellular automata used for land use change modeling
CN106960065A (zh) 一种复杂仿真系统可信度的鲁棒评估方法及系统
CN106489068B (zh) 测量值分析装置以及测量值分析方法
Pai et al. Comparing structural identification methodologies for fatigue life prediction of a highway bridge
CN108830554A (zh) 基于任务模型的数据成果信息质量智能检测方法和系统
Hanberry et al. Prevalence, statistical thresholds, and accuracy assessment for species distribution models
CN114490404A (zh) 一种测试用例确定方法、装置、电子设备及存储介质
Szendrő et al. The sectoral adaptive capacity index of Hungarian road transport
Lim et al. Choosing effective dates from multiple optima in technology forecasting using data envelopment analysis (TFDEA)
CN110197207A (zh) 对未归类用户群进行归类的方法及相关装置
Wan et al. Application of deep learning in land use classification for soil erosion using remote sensing
Zhang et al. Analyzing the effects of stochastic perturbation and fuzzy distance transformation on Wuhan urban growth simulation
Ahmad et al. Towards the formal reliability analysis of oil and gas pipelines
CN109710888A (zh) 一种基于惩罚回归的天然气管道损坏预测方法及装置
KR20170040908A (ko) 확률적 가스폭발 시나리오 산출 시스템 및 이를 사용한 확률적 가스폭발 시나리오 산출 방법
CN111046475A (zh) 一种房屋建筑面积的计算方法、装置和存储介质
Chen et al. A new evaluation method for slope stability based on TOPSIS and MCS
Hein et al. Implementing NEPA in the age of climate change
Erdal Prediction of pipeline projects construction costs utilizing machin e learning techniques
Anderson et al. Resolving the issue of multiple optima in Technology Forecasting using Data Envelopment Analysis
CN105824871A (zh) 一种图片检测方法与设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230925

Address after: Unit I102, 14th Floor, No. 8, Area A, Hantian Science and Technology City, No. 17, Shenhai Road, Guicheng Street, Nanhai District, Foshan City, Guangdong Province, 528000

Patentee after: Foshan Dayan Data Technology Co.,Ltd.

Address before: 528000 No. 18, Jiangwan Road, Chancheng District, Guangdong, Foshan

Patentee before: FOSHAN University