一种基于大数据算法的机泵选型及分析技术
技术领域
本发明涉及石油化工技术领域,特别是指一种基于大数据算法的机泵选型及分析技术。
背景技术
机泵等转动设备是各工业生产企业中普遍使用的一类通用设备,在各生产企业中均属于主要能耗设备,检修维护费用高,因此选择合理和高效的产品,对降低运行成本十分重要。机泵产品不断更新换代,新的制造工艺,材料和技术层出不穷,但目前各生产企业在选择机泵设备时,所选设备品牌和类型,主要依赖设计人员自身,以及本单位的工程经验,再加上机泵的生产厂家数量有限,因此选型时局限性较大。
发明内容
为进一步解决上述问题,本发明提供一种基于大数据算法的机泵选型及分析技术,属于石油化工技术领域。
本发明提供一种基于大数据算法的机泵选型及分析技术,包括:
S1、获取机泵数据,整合所述机泵数据并建立数据库;
S2、对所述数据库进行数据统计和分析;
S3、对所述数据库进行挖掘并建立预测模型,并根据所述预测模型进行选型评估。
本发明提供了一种整合各个厂家,设计单位和使用单位工程数据,基于大数据算法的选型分析技术及平台,解决选型过程中对设计人员能力水平的依赖,提供一条由设计人员直接从多家厂家产品库中直接选型的途径,综合上下游单位的使用经验和工程数据进行分析,使选型达到更加客观科学;可以在选型阶段,对工程项目的各类机泵设备在设计寿命时间内的成本进行综合评估,达到降低整体运行成本目的;对设计单位,可使本单位的工程经验和数据在平台上持续完善,更有利于操作人员的经验积累。
优选的,所述S1步骤,包括:
S11、采集并整合所述机泵数据;
S12、将所述机泵数据导入数据库,并进行所述机泵数据的预处理。
其中,需要采集并整合的数据包括:不同厂家的产品数据,本单位各实际工程的数据,其他单位各实际工程的数据,机泵使用单位的运行,维检修数据。
数据主要具有三类:
第一类是操作运行类数据,主要从设计单位/使用单位/厂家的实际工程项目获得,以及厂家产品数据获得;
第二类是泵的性能参数,主要从各个生产厂家产品数据库获取;
第三类是使用过程中故障和维检修数据,主要从使用单位和厂家产品数据获得。
整合数据库的机泵数据时,统一所述数据的格式和单位,并且对数据进行大小类型的存储,如设定一个大类为温度,则在大类中细分为工作温度,环境温度,报警温度等小类进行分开存储。
数据的预处理主要指机泵数据的审核、筛选和排序,通过算法筛选出缺漏数据并进行反馈和审核,审核包括机器审核和人工审核,其中机器审核会通过求均值或拟合等方式将一定范围内的缺漏进行自主补充并记录该行为,较大的或无法自动补充的缺漏会上报人工审核,由人工审核继续补充数据缺漏错误等问题。最后通过算法对无缺漏的数据进行排序整理。
优选的,所述S2步骤,包括:
S21、获取预设工况下的一种泵型的概率分布;
S22、对机泵进行故障分析,并获取所述泵型的故障点及故障概率分布;
S23、对机泵进行效率统计,获得所述泵型的效率区间。
可选的,所述效率区间也可以由相似工况下已经投产的机泵的成本分析结果来进行辅助计算。
优选的,所述S3步骤,包括:
S31、运用第一大数据算法对所述数据库进行挖掘,建立泵型预测模型;
S32、运用第二大数据算法对所述数据库进行挖掘,建立机泵的效率预测模型;
S33、运用第三大数据算法对所述数据库进行挖掘,建立故障点和频率的预测模型;
S34、根据所述泵型预测模型,效率预测模型,以及故障点和频率的预测模型进行选型评估。
优选的,通过回归算法和多维关联算法,挖掘流量,扬程,粘度等要素与泵型的关联规则,建立泵型预测模型;所述回归算法包括线性回归和梯度下降等算法,此处优选梯度下降法。
通过回归算法,多维关联算法,聚类算法,对某泵型,挖掘流量,扬程,粘度,功率,转速等要素与效率的关联规则,建立泵的效率预测模型;
通过回归算法和多维关联算法,对某泵型,挖掘功率,转速,额定流量与最佳效率点流量比例等要素与故障点的关联规则,建立故障点和频率的预测模型。
优选的,在进行选型评估时,按照预设工况条件为三个模型的结果增加影响权重,并根据加权后的计算结果选择得分最高值,即在预设工况条件下,选取该机泵经济效益最大化,作为选型评估结果进行输出。
可选的,对预设工况条件下故障率超过预设数值的机泵进行报警处理,并由操作人员对权重进行手动调节。
优选的,所述S11步骤,还包括获取机泵附属系统数据,并对所述机泵附属系统数据整合。
机泵附属系统数据,包括所选联轴器,机封,机封冲洗方案,润滑系统等。
优选的,所述S3步骤之后,还包括:
将所述选型评估的结果数据储存至所述数据库,所述结果数据包括最终选型、预设工况、数据统计和分析的结果和三种预测模型的权重。
本发明还提供一种基于大数据算法的机泵选型及分析平台,所述平台包括:
机泵数据管理模块,用于获取机泵数据,整合所述机泵数据并建立数据库;
机泵数据统计模块,用于对所述数据库进行数据统计和分析;
机泵选型预测模块,用于对所述数据库进行挖掘并建立预测模型,并根据所述预测模型进行选型评估。
优选的,所述机泵数据管理模块,包括:
数据采集单元,用于采集并整合所述机泵数据;
预处理单元,用于将所述机泵数据导入数据库,并进行所述机泵数据的预处理。
优选的,所述机泵数据统计模块,包括:
选型分析单元,用于获取预设工况下的一种泵型的概率分布;
故障分析单元,用于对所述泵型进行故障分析,并获取所述泵型的故障点及故障概率分布;
效率分析单元,用于对所述泵型进行效率统计,获得所述泵型的效率区间。
优选的,所述机泵选型预测模块,包括:
泵型预测单元,用于运用第一大数据算法对所述数据库进行挖掘,建立泵型预测模型;
效率预测单元,用于运用第二大数据算法对所述数据库进行挖掘,建立机泵的效率预测模型;
故障预测单元,用于运用第三大数据算法对所述数据库进行挖掘,建立故障点和频率的预测模型;
结果整合单元,用于根据所述泵型预测模型,效率预测模型,以及故障点和频率的预测模型进行选型评估。
本申请能够给机泵及其附属系统选型,在大数据分析的基础上,实现选型产品技术最优,提高整个系统的可靠性;以降低整体运行成本为原则实现机泵选型。在设计阶段通过本技术对某项目的所有拟选设备进行能耗分析和故障预测,依据分析结果,考虑设备的可靠性、能耗和维检修费等指标进行综合加权评估,最终选择安全经济的设备,实现整体成本水平的降低;最后,本技术使用到的数据库可以随时进行升级维护,使得选型分析越来越可靠,并提高设备的数字化管理水平;更改相应的大数据算法之后,本申请还可以通过数据分析可以提取其他有价值信息。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本申请实施例中的一种基于大数据算法的机泵选型及分析技术流程图;
图2是本申请实施例中的实际系统流程图;
图3是本申请实施例中的一种基于大数据算法的机泵选型及分析平台示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
本发明的实施例提供一种基于大数据算法的机泵选型及分析技术,如图1所示,包括:
S1、获取机泵数据,整合所述机泵数据并建立数据库;
S2、对所述数据库进行数据统计和分析;
S3、对所述数据库进行挖掘并建立预测模型,并根据所述预测模型进行选型评估。
本申请能够给机泵及其附属系统选型,实际系统流程图如图2所示,在大数据分析的基础上,实现选型产品技术最优,提高整个系统的可靠性;以降低整体运行成本为原则实现机泵选型。在设计阶段通过本技术对某项目的所有拟选设备进行能耗分析和故障预测,依据分析结果,考虑设备的可靠性、能耗和维检修费等指标进行综合加权评估,最终选择安全经济的设备,实现整体成本水平的降低;最后,本技术使用到的数据库可以随时进行升级维护,使得选型分析越来越可靠,并提高设备的数字化管理水平;本申请还可以通过数据分析可以提取其他有价值信息,例如某厂家的产品质量水平。
在一个具体的实施例中,用户输入额定流量Q、额定扬程H、安装方式IS、介质名称M和介质粘度V等数据内容,可以选择指定或不指定原型或以往案例参考,并输入选型及分析大数据模块进行判断处理。模块从数据方获得相应的补充数据之后,通过多种算法对数据库进行处理分析,并建立泵型、能耗指数、运行维护费用和故障分析四个不同的预测模型,剔除不合格数据,并按照预设顺序和权重,由模块得出满足最低消耗的泵型选型结果。
优选的,所述S1步骤,包括:
S11、采集并整合所述机泵数据;
S12、将所述机泵数据导入数据库,并进行所述机泵数据的预处理。
其中,需要采集并整合的数据包括:不同厂家的产品数据,本单位各实际工程的数据,其他单位各实际工程的数据,机泵使用单位的运行,维检修数据。
在一个具体的实施例中,本申请所采集的机泵类型包括离心泵、柱塞泵、单螺杆泵、双螺杆泵、齿轮泵、罗茨泵和隔膜泵等石油化工天然气行业的常用泵型。
数据主要具有三类:
第一类是操作运行类数据。包括额定流量、额定扬程、介质、介质密度、介质饱和蒸气压、介质粘度、有毒有害成分及含量、工作温度、环境温度、环境湿度和环境沙尘情况等,此部分数据主要从设计单位/使用单位/厂家的实际工程项目获得,以及厂家产品数据获得;
第二类是泵的性能参数。主要从各个生产厂家产品数据库获取,包括泵的标准、类型、汽蚀余量、转速、比转速、最佳效率点流量、工作范围、效率、能耗指数、机封方案、机封冲洗方案、选驱动机类型、电源的电压、频率、相位、电机型号、电机额定功率等;
第三类是使用过程中故障和维检修数据。主要从使用单位和厂家产品数据获得,包括故障部件、故障频率、维护周期、易损件成本和维修成本等。
故障点按照类型进行统计,比如离心泵故障点包括叶轮、轴、径向轴承、止推轴承、联轴器、机封、冲洗系统和电机等,螺杆泵分为泵壳、转子、定子、轴承、万向节、联轴器、机封、机封冲洗和电机等。
在一个具体的实施例中,可以通过输入型谱图、轴功率曲线图等来自动估算数据库缺漏数据。
整合数据库的机泵数据时,统一所述数据的格式和单位,并且对数据进行大小类型的存储,如设定一个大类为温度,则在大类中细分为工作温度,环境温度,报警温度等小类进行分开存储。
数据的预处理主要指机泵数据的审核、筛选和排序,通过算法筛选出缺漏数据并进行反馈和审核,审核包括机器审核和人工审核,其中机器审核会通过求均值或拟合等方式将一定范围内的缺漏进行自主补充并记录该行为,较大的或无法自动补充的缺漏会上报人工审核,由人工审核继续补充数据缺漏错误等问题。最后通过算法对无缺漏的数据进行排序整理。
优选的,所述S2步骤,包括:
S21、获取预设工况下的一种泵型的概率分布;
S22、对机泵进行故障分析,并获取所述泵型的故障点及故障概率分布;
S23、对机泵进行效率统计,获得所述泵型的效率区间。
优选的,所述S3步骤,包括:
S31、运用第一大数据算法对所述数据库进行挖掘,建立泵型预测模型;
S32、运用第二大数据算法对所述数据库进行挖掘,建立机泵的效率预测模型;
S33、运用第三大数据算法对所述数据库进行挖掘,建立故障点和频率的预测模型;
S34、根据所述泵型预测模型,效率预测模型,以及故障点和频率的预测模型进行选型评估。
可选的,上述第一、第二或第三大数据的算法,包括分类,回归分析,聚类,关联规则,神经网络方法等算法。
优选的,通过回归算法和多维关联算法,挖掘流量,扬程,粘度等要素与泵型的关联规则,建立泵型预测模型;
可选的,所述多维关联算法,先产生数据关联规则集,然后进行规则存储和规则剪枝,最后选择合适的关联规则对数据对象进行分类。
通过回归算法,多维关联算法,聚类算法,对某泵型,挖掘流量,扬程,粘度,功率,转速等要素与效率的关联规则,建立泵的效率预测模型,对机泵进行效率分析和预测;
通过回归算法和多维关联算法,对某泵型,挖掘功率,转速,叶轮尺寸,额定流量与最佳效率点流量比例等要素与故障点的关联规则,建立故障点和频率的预测模型,并根据数据库中的历史故障数据,计算泵的工作效率和经济损失效率数据。
优选的,在进行选型评估时,按照预设工况条件为三个模型的结果增加影响权重,并根据加权后的计算结果选择得分最高值,作为选型评估结果进行输出。
优选的,所述S11步骤,还包括获取机泵附属系统数据,并对所述机泵附属系统数据整合。
附属系统数据,包括所选联轴器,机封,机封冲洗方案,机封材质,机封厂家,润滑系统,润滑系统材质等。
优选的,所述S3步骤之后,还包括:
将所述选型评估的结果数据储存至所述数据库,所述结果数据包括最终选型、预设工况、数据统计和分析的结果和三种预测模型的权重。
可选的,在所述S1步骤之前,以预设工况作为检索条件检索已有数据库,如果该工况已经做过机泵选型,则调取改机泵选型评估数据,进行加权重新计算或直接获得评估结果。
本发明的实施例还提供一种基于大数据算法的机泵选型及分析平台,如图3所示,所述平台包括:
机泵数据管理模块71,用于获取机泵数据,整合所述机泵数据并建立数据库;
机泵数据统计模块72,用于对所述数据库进行数据统计和分析;
机泵选型预测模块73,用于对所述数据库进行挖掘并建立预测模型,并根据所述预测模型进行选型评估。
优选的,所述机泵数据管理模块,包括:
数据采集单元,用于采集并整合所述机泵数据;
预处理单元,用于将所述机泵数据导入数据库,并进行所述机泵数据的预处理。
优选的,所述机泵数据统计模块,包括:
选型分析单元,用于获取预设工况下的一种泵型的概率分布;
故障分析单元,用于对所述泵型进行故障分析,并获取所述泵型的故障点及故障概率分布;
效率分析单元,用于对所述泵型进行效率统计,获得所述泵型的效率区间。
优选的,所述机泵选型预测模块,包括:
泵型预测单元,用于运用第一大数据算法对所述数据库进行挖掘,建立泵型预测模型;
效率预测单元,用于运用第二大数据算法对所述数据库进行挖掘,建立机泵的效率预测模型;
故障预测单元,用于运用第三大数据算法对所述数据库进行挖掘,建立故障点和频率的预测模型;
结果整合单元,用于根据所述泵型预测模型,效率预测模型,以及故障点和频率的预测模型进行选型评估。
本发明的实施例还提供一种电子设备,设备包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一种基于大数据算法的机泵选型及分析技术的步骤。
本发明的实施例还提供一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述任一种基于大数据算法的机泵选型及分析技术的步骤。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。