CN117893643A - 油气站压缩机气体泄露图像生成方法、装置、设备及介质 - Google Patents

油气站压缩机气体泄露图像生成方法、装置、设备及介质 Download PDF

Info

Publication number
CN117893643A
CN117893643A CN202410302788.5A CN202410302788A CN117893643A CN 117893643 A CN117893643 A CN 117893643A CN 202410302788 A CN202410302788 A CN 202410302788A CN 117893643 A CN117893643 A CN 117893643A
Authority
CN
China
Prior art keywords
image
letter
target
processed
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410302788.5A
Other languages
English (en)
Other versions
CN117893643B (zh
Inventor
陈友明
陈思竹
姜超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Honghe Digital Intelligence Group Co ltd
Original Assignee
Sichuan Honghe Digital Intelligence Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Honghe Digital Intelligence Group Co ltd filed Critical Sichuan Honghe Digital Intelligence Group Co ltd
Priority to CN202410302788.5A priority Critical patent/CN117893643B/zh
Publication of CN117893643A publication Critical patent/CN117893643A/zh
Application granted granted Critical
Publication of CN117893643B publication Critical patent/CN117893643B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

本发明提供了一种油气站压缩机气体泄露图像生成方法、装置、设备及介质,涉及图像处理技术领域,包括:获取待处理图像;基于预设字母形式,随机生成目标字母图像;创建目标尺寸的空白图像,基于目标尺寸以及目标字母图像,生成目标字母图像的起点位置,并按照起点位置将目标字母图像绘制在空白图像上,作为蒙版图像;将待处理图像、蒙版图像和提示词输入到图像生成模型,以将蒙版图像作为图像绘制的基础图素,基于提示词对蒙版区域进行局部重绘,生成目标图像。本发明以随机生成目标字母图像作为蒙版图像,对待处理图像的蒙版区域进行局部重绘,从而确保生成的图像像素之间具有自然的关联,进而稳定高效地获得压缩机气体泄露图像数据。

Description

油气站压缩机气体泄露图像生成方法、装置、设备及介质
技术领域
本发明属于图像处理技术领域,特别是涉及一种油气站压缩机气体泄露图像生成方法、装置、设备及介质。
背景技术
近年来,图像识别模型已经在各个领域的真实场景中得到了应用,而作为图像识别模型训练中非常重要的一个因素,图像数据的质量会对模型训练效果的造成非常大的影响。
在能源领域中,为得到精度较高的图像识别模型,需要大量的高质量训练数据,在现有技术中,一种方法是故意破坏压缩机,获取压缩机气体泄露的图像作为图像识别模型的训练数据用于训练的图像数据,另一种方法是通过人为的修图操作,在已有的正常压缩机图像添加气体泄露的图像特征作为图像识别模型的训练数据,上述现有技术普遍存在获取困难,或是与现实使用场景关联度不高的问题。
所以,目前亟需一种压缩机气体泄露图像数据的获取方法,既可以保证图像数据更加贴近现实,也可以按照同样的标准批量生成足够数据的高质量图像训练数据,同时节约大量的人力资源和时间成本。
发明内容
有鉴于此,本发明提供一种油气站压缩机气体泄露图像生成方法、装置、设备及介质,旨在解决如何快速高效的生成高质量的压缩机气体泄露图像数据的问题。
依据本发明的第一方面,提供了一种油气站压缩机气体泄露图像生成方法,包括:
获取待处理图像,所述待处理图像包含特定背景特征,所述特定背景特征为压缩机区域图像;
依据特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域;
基于预设字母形式,随机生成目标字母图像,所述预设字母形式至少包括目标字母、字母字体和字母字体大小;
创建目标尺寸的空白图像,基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像;
将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像。
可选地,所述获取待处理图像,包括:
获取原始图像,所述原始图像包含至少一个所述特定背景特征;
以所述目标尺寸为目标,调整所述原始图像的尺寸,得到所述待处理图像。
可选地,所述基于预设字母形式,随机生成目标字母图像,包括:
获取字母形式集合,所述字母形式集合至少包括字母集合、字母字体集合以及字体大小区间;
基于所述字母集合,随机选取属于所述字母集合的任意一个字母,作为所述目标字母;
基于所述字母字体集合以及所述字体大小区间,随机生成所述目标字母对应的字母字体以及字母字体大小,得到所述预设字母形式;
按照所述预设字母形式对所述目标字母进行调整,生成所述目标字母图像。
可选地,所述基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像,包括:
对所述目标尺寸和所述字母字体大小做差值计算,得到所述目标字母图像的起点位置的最大坐标值;
获取所述目标字母图像的起点位置范围,所述起点位置范围的坐标值为坐标原点到所述起点位置的最大坐标值;
基于所述起点位置范围,随机生成所述目标字母图像的绘制起点,作为所述目标字母图像的起点位置;
将所述目标字母图像绘制到所述空白图像上,得到所述蒙版图像,所述目标字母图像起点位置的坐标与所述目标字母图像的顶点或中心点的坐标相同。
可选地,所述提示词包括正面提示词和负面提示词,所述将所述待处理图像、所述蒙版图像和所述提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,包括:
分别按照所述正面提示词和所述负面提示词对所述图像生成模型进行参数设置,所述正面提示词用于指导所述图像生成模型生成需要的图像特征,所述负面提示词用于防止所述图像生成模型生成不需要的图像特征;
将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像;
将所述待处理图像的蒙版区域重采样图像和所述待处理图像输入到所述参数设置后的图像生成模型,对所述蒙版区域重采样图像进行局部重绘,得到所述目标图像。
可选地,所述将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像,包括:
获取噪声图素,并基于所述待处理图像的蒙版区域的位置范围,随机生成所述噪声图素的绘制起点;
将所述噪声图素绘制到所述待处理图像的蒙版区域上,得到所述待处理图像的蒙版区域随机噪声图像;
依据所述蒙版图像、所述正面提示词和所述负面提示词,分别生成需要去掉的噪声图素和需要增加的目标图素;
基于所述需要去掉的噪声元素和所述需要增加的目标图素,对所述待处理图像的蒙版区域进行采样,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,控制所述蒙版图像在所述蒙版区域中的稳定扩散,并保持所述待处理图像的非蒙版区域的图像保持不变,得到重采样迭代图像;
依据所述蒙版图像、所述正面提示词和所述负面提示词,对所述待处理图像的蒙版区域进行预设次数的重采样,将最后一次重采样得到的所述重采样迭代图像作为所述待处理图像的蒙版区域重采样图像。
可选地,在所述预设次数重采样的过程中,逐渐减少所述待处理图像蒙版区域中需要去掉的噪声图素,逐渐增加所述待处理图像蒙版区域中需要增加的目标图素,并保持所述待处理图像的非蒙版区域保持不变。
依据本发明的第二方面,提供了一种油气站压缩机气体泄露图像生成装置,该装置可以包括:
待处理图像获取模块,用于获取待处理图像,所述待处理图像包含特定背景特征;
待处理图像区域划分模块,用于依据特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域;
字母图像生成模块,用于基于预设字母形式,随机生成目标字母图像,所述预设字母形式至少包括目标字母、字母字体和字母字体大小;
蒙版图像生成模块,用于创建目标尺寸的空白图像,基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像;
目标图像生成模块,用于将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像。
可选地,所述待处理图像获取模块,包括:
原始图像获取子模块,用于获取原始图像,所述原始图像包含至少一个所述特定背景特征;
尺寸调整子模块,用于以所述目标尺寸为目标,调整所述原始图像的尺寸,得到所述待处理图像;
可选地,所述字母图像生成模块,包括:
字母形式集合获取子模块,用于获取字母形式集合,所述字母形式集合至少包括字母集合、字母字体集合以及字体大小区间;
目标字母选取子模块,用于基于所述字母集合,随机选取属于所述字母集合的任意一个字母,作为所述目标字母;
字母形式生成子模块,用于基于所述字母字体集合以及所述字体大小区间,随机生成所述目标字母对应的字母字体以及字母字体大小,得到所述预设字母形式;
目标字母调整子模块,用于按照所述预设字母形式对所述目标字母进行调整,生成所述目标字母图像。
可选地,所述蒙版图像生成模块,包括:
差值计算子模块,用于对所述目标尺寸和所述字母字体大小做差值计算,得到所述目标字母图像的起点位置的最大坐标值;
起点范围获取子模块,用于获取所述目标字母图像的起点位置范围,所述起点位置范围的坐标值为坐标原点到所述起点位置的最大坐标值;
绘制起点生成子模块,用于基于所述起点位置范围,随机生成所述目标字母图像的绘制起点,作为所述目标字母图像的起点位置;
绘制子模块,用于将所述目标字母图像绘制到所述空白图像上,得到所述蒙版图像,所述目标字母图像起点位置的坐标与所述目标字母图像的顶点或中心点的坐标相同。
可选地,目标图像生成模块,包括:
参数设置子模块,用于分别按照所述正面提示词和所述负面提示词对所述图像生成模型进行参数设置,所述正面提示词用于指导所述图像生成模型生成需要的图像特征,所述负面提示词用于防止所述图像生成模型生成不需要的图像特征;
重采样子模块,用于将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像;
局部重绘子模块,用于将所述待处理图像的蒙版区域重采样图像和所述待处理图像输入到所述参数设置后的图像生成模型,对所述蒙版区域重采样图像进行局部重绘,得到所述目标图像。
噪声图素获取子模块,用于获取噪声图素,并基于所述待处理图像的蒙版区域的位置范围,随机生成所述噪声图素的绘制起点;
噪声图像生成子模块,用于将所述噪声图素绘制到所述待处理图像的蒙版区域上,得到所述待处理图像的蒙版区域随机噪声图像;
图素调整子模块,用于依据所述蒙版图像、所述正面提示词和所述负面提示词,分别生成需要去掉的噪声图素和需要增加的目标图素;
重采样迭代子模块,用于基于所述需要去掉的噪声元素和所述需要增加的目标图素,对所述待处理图像的蒙版区域进行采样,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,控制所述蒙版图像在所述蒙版区域中的稳定扩散,并保持所述待处理图像的非蒙版区域的图像保持不变,得到重采样迭代图像;
重采样输出子模块,用于依据所述蒙版图像、所述正面提示词和所述负面提示词,对所述待处理图像的蒙版区域进行预设次数的重采样,将最后一次重采样得到的所述重采样迭代图像作为所述待处理图像的蒙版区域重采样图像。
重采样控制子模块,用于在所述预设次数重采样的过程中,逐渐减少所述待处理图像蒙版区域中需要去掉的噪声图素,逐渐增加所述待处理图像蒙版区域中需要增加的目标图素,并保持所述待处理图像的非蒙版区域保持不变。
第三方面,本发明实施例提供了一种电子设备,所述电子设备包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行如第一方面所述的油气站压缩机气体泄露图像生成方法中包括的步骤。
第四方面,本发明实施例提供了一种计算机存储介质,其特征在于,所述计算机存储介质上存储程序指令,所述程序指令被处理器执行时实现如第一方面所述的油气站压缩机气体泄露图像生成方法中包括的步骤。
本发明提供了一种油气站压缩机气体泄露图像生成方法、装置、设备及介质,包括:获取待处理图像,基于预设字母形式,随机生成目标字母图像,按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像,将蒙版图像作为图像绘制的基础图素,基于提示词对蒙版区域进行局部重绘,生成目标图像。本发明具有如下有益效果:
(1)以随机生成目标字母图像作为蒙版图像,对待处理图像的蒙版区域进行局部重绘,从而可以确保生成的图像像素之间具有自然的关联,没有违和感。
(2)在对蒙版区域进行局部重绘的过程中加入了提示词的指导,控制图像生成过程中的图素的表现效果,从而确保生成的图像具备与实际场景相符的特征,可以准确反映出气体泄露的真实情况,进而为能源领域的压缩机气体泄露图像数据模拟生成提供了一种高效可行的解决方案。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例提供的一种油气站压缩机气体泄露图像生成方法的步骤流程图;
图2是本发明实施例提供的一种油气站压缩机气体泄露图像生成装置的框图;
图3是本发明实施例提供的一种电子设备的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
本发明提供一种油气站压缩机气体泄露图像生成方法,以随机生成目标字母图像作为蒙版图像,对待处理图像的蒙版区域进行局部重绘,从而确保生成的图像像素之间具有自然的关联,没有违和感,进而稳定高效地获得压缩机气体泄露图像数据,图1是本发明实施例提供的一种油气站压缩机气体泄露图像生成方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、获取待处理图像。
获取待处理图像,所述待处理图像包含特定背景特征,所述特定背景特征为压缩机区域图像。
在该步骤中,待处理图像可以是在现实场景中,通过图像采集装置获取的包含特定背景特征的图像,例如,可以通过图像采集装置获取包括正常压缩机特定背景特征的图像。
在本发明实施例中,所述待处理图像可以为用于对图像识别模型进行训练的图像,所述图像识别模型可以是基于开源的可扩展和高效的目标检测算法的神经网络模型,用于对图像进行目标检测、分类识别、特征提取等,因此,所述待处理图像可以是任何涉及到影像分类、检测的图像,包括处于运转状态的电子设备影像、处于正常维护保养状态的电子设备影像以及处于维修状态的电子设备影像。
具体而言,所述获取待处理图像包括如下步骤:
首先,获取原始图像,所述原始图像包含至少一个特定背景特征。
在该步骤中,所述原始图像可以是包含一个或多个特定背景特征,例如,所述特定背景特征可以通过图像采集装置,采集到的现实场景中包含正常运转的压缩机特征图像数据。
然后,以目标尺寸为目标,调整所述原始图像的尺寸,得到所述待处理图像。
在该步骤中,所述目标尺寸通常是依据最终生成的目标图像数据所需要的仿真程度,以及单位时间内需要批量生成的目标图像数据数量的综合考虑后,进行预先设置,在本实施例中,可以将所述目标尺寸设置为512*512,即目标图像数据的横坐标和纵坐标分别包含512个像素点数据信息,这样一来,就可以在可以接收的计算时间内,生成足够多符合图像识别模型训练需求的高仿真气体泄露图像数据,使得训练得到的图像识别模型可以更好的提高现实场景中的应用效果。
此外,在本发明实施例中,在调整所述原始图像的尺寸的过程中,可以按照所述目标的横坐标或纵坐标尺寸,对所述原始图像的特定背景特征进行等比例的调整,使得所述待处理图像中,包含有两个区域,即原始图像区域和空白图像区域,例如,所述目标尺寸是512*512,所述原始图像的尺寸是256*100,则调整之后,所述待处理图像尺寸是512*512,其中特定背景图像区域为512*200,空白图像区域为512*312,所述空白图像区域中每个像素点的像素值通常为(0,0,0);也可以按照所述目标的横坐标或纵坐标尺寸,对所述原始图像的特定背景特征进行全尺寸的调整,使得所述待处理图像中只有原始图像区域,而没有空白图像区域,例如,所述目标尺寸是512*512,所述原始图像的尺寸是256*100,则调整之后,所述待处理图像尺寸是512*512,其中特定背景图像区域为512*512,不存在空白图像区域。
步骤102、依据所述特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域。
依据所述特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域。
在该步骤中,在将所述待处理图像输入到所述图像生成模型之前,通常会对所述待处理图像进行特征提取的预处理,提取出待处理图像中包含特定背景特征的图像区域与不包含特定背景特征的图像区域,此外,可以通过调整特征提取参数,扩大或缩小特定背景特征的图像区域范围,以及两个图像区域平滑过渡或锐化程度。
其中,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域,以使在对所述蒙版区域的局部重绘过程中,所述非蒙版区域的特定背景特征图像数据得到完整的保留,增加了目标图像中批量生成的气体泄露图像数据与现实场景采集得到的压缩机图像之间像素的自然关联,得到高仿真的图像数据,该高仿真的图像数据可以用来训练应用于真实场景中的图像识别模型。
在本发明实施例中,可以预先设置待处理图像包括蒙版区域与非蒙版区域,所述蒙版区域包含有正常压缩机的特征图像的区域,而所述非蒙版区域为待生成气体泄露图像数据的区域,这样一来,就可以在图像生成模型中保持所述蒙版区域不变,而对所述非蒙版区域进行局部重绘,既可以保证图像数据更加贴近现实,也可以按照同样的标准批量生成足够数据的高质量图像训练数据,同时节约大量的人力资源和时间成本。
步骤103、基于预设字母形式,随机生成目标字母图像。
基于预设字母形式,随机生成目标字母图像,所述预设字母形式至少包括目标字母、字母字体和字母字体大小。
在该步骤中,可以依照所述预设字母形式,随机生成所述目标字母图像,以作为绘制图素,在所述待处理图像的蒙版区域中按照预设次数的重采样进行局部重绘,从而确保高度仿真的气体泄露图像信息可以均匀分散在待处理图像中的,避免了像素之间缺乏自然的关联的可能。
在本发明实施例中,为了使生成的目标图像最大限定的贴近现实图像数据,所述的预设字母形式可以优选一个获取范围,其中,所述目标字母为所有英文字母中的一个或多个字母,所述字母字体为常见计算机字母字体中的一种或多种;所述字母字体大小为小于所述待处理图像可显示范围的字体大小。需要说明的是,所述目标字母、字母字体和字母字体大小的优选获取范围可以是通过图像生成模型的预生成测试中,对比预生成图像数据的仿真效果筛选得出。示例性地,所述目标字母的优选获取范围可以是:“C”、“S”、“X”、“U”、“V”,所述字母字体的优选获取范围可以是:Calibri、Ebrima、Modern、Segoe UI,所述字母字体大小的优选获取范围可以是:300~500,上述示例只是为了使本领域技术人员更好的理解本发明的方案给出的一些优选的情况,具体的预设字母形式可根据实际情况确定,本发明在此不作限制。
具体而言,所述基于预设字母形式,随机生成目标字母图像的过程包括如下步骤:
首先,获取字母形式集合,所述字母形式集合至少包括字母集合、字母字体集合以及字体大小区间。
在该步骤中,可以将标准图像数据输入到图像生成模型中,进行预生成图像,根据所述预生成图像中气体泄露图像数据的仿真效果,预先对所述字母集合、字母字体集合以及字体大小区间进行设置,具体而言,所述字母集合可以包括:C、S、X、U、V,所述字母字体集合可以包括:Calibri、Ebrima、Modern、Segoe UI,所述字体大小区间可以包括:300~500。
然后,基于所述字母集合,随机选取属于所述字母集合的任意一个字母,作为所述目标字母,基于所述字母字体集合以及所述字体大小区间,随机生成所述目标字母对应的字母字体以及字母字体大小,得到所述预设字母形式,按照所述预设字母形式对所述目标字母进行调整,生成所述目标字母图像。
在该步骤中,可以基于所述的字母集合、字母字体集合以及字体大小区间,依次随机生成所述目标字母、所述字母字体以及字母字体大小,也可以同时随机生成所述目标字母、所述字母字体以及字母字体大小,得到所述预设字母形式,再按照所述预设字母形式对所述目标字母进行调整,生成所述目标字母图像,例如,所述字母集合可以包括:“C、S、X、U、V”,所述字母字体集合可以包括:“Calibri、Ebrima、Modern、Segoe UI”,所述字体大小区间可以包括:“300~500”,从上述各个字母形式集合进行所述预设字母形式的随机生成,得到的预设字母形式为:“C”、“Calibri”、“300”,按照上述生成的预设字母形式对所述目标字母进行调整,生成字母为“C”,字母字体为“Calibri”,字母字体大小为“300”的目标字母图像。
步骤104、创建目标尺寸的空白图像,基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像。
在该步骤中,可以在空白图像中的全部或部分区域按照所述目标字母图像进行随机的生成,从而得到将空白图像进行绘制增强后的蒙版图像。
具体地,可以在所述空白图像的全部区域按照所述目标字母图像进行随机的生成,也可以在所述空白图像的部分区域按照所述目标字母图像进行随机的生成,例如,可以按照预先设定的所述目标字母图像的起点位置,将所述目标字母图像绘制在所述空白图像上,从而在确保目标字母图像的信息均匀分散在所述空白图像上的同时,还可以确保图像信息的生成过程具有一定程度的随机性,增加对空白图像进行图像数据增强的多样性,从而得到更多的蒙版图像。
在本发明实施例中,所述空白图像的目标尺寸一般根据所述图像生成模型的处理能力进行预先设置,例如,通过将标准图像数据输入到图像生成模型进行目标图像的预生成测试,会发现不同像素信息大小的标准图像数据所对应的目标图像,在图像生成效率与图像生成质量上都会有所差异,最后,在综合考虑批量生成目标图像的计算效率,以及批量生成目标图像的仿真程度,可以选择512*512作为所述空白图像的目标尺寸。
具体而言,所述基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像的过程包括如下步骤:
首先,对所述目标尺寸和所述字母字体大小做差值计算,得到所述目标字母图像的起点位置的最大坐标值,获取所述目标字母图像的起点位置范围。在该步骤中,所述起点位置范围的坐标值为坐标原点到所述起点位置的最大坐标值,可以在获取所述目标字母图像的起点位置的坐标值范围之前,获取所述目标字母图像的起点位置的最大坐标值。
其中,所述目标字母图像的起点位置的最大坐标值可以在预先设置的目标尺寸,以及随机生成字母字体大小之后,通过计算得到,例如,可以将所述的目标尺寸预设为512*512,随机生成的字母字体大小为300,则所述目标字母图像的起点位置的最大坐标值为:x:(512-300)、y:(512-300),进而得到所述起点位置的坐标值范围:x:(0~(512-300))、y:(0~(512-300))。
然后,基于所述起点位置范围,随机生成所述目标字母图像的绘制起点,作为所述目标字母图像的起点位置,将所述目标字母图像绘制到所述空白图像上,得到所述蒙版图像。
在该步骤中,为了定位所述目标字母图像在所述空白图像上的具体位置,可以在所述目标字母图像上选取一个特定像素点,使所述特定像素点的坐标值与随机生成的绘制起点的坐标值保持一致,优选的特点像素点可以是所述目标字母图像起点位置的坐标与所述目标字母图像的顶点或中心点,例如,所述起点位置的坐标值范围为:(x:(0~212),y:(0~212)),在上述坐标值范围内随机生成的绘制起点坐标值为:(x:100,y:100),同时选取所述特定像素点为所述目标字母图像的上顶点,即依据所述目标字母图像上顶点像素点的坐标值:(x:100,y:100),将所述目标字母图像绘制到所述空白图像上,并定位在所述空白图像像素点坐标范围内的特定区域。
此外,在本发明实施中,在对所述空白图像每个待生成区域进行图像信息的生成时的起点位置范围,是所述目标字母图像在预设范围内的像素点坐标范围,所述像素点坐标范围可以包括像素点坐标原点,以及所述目标字母图像的所占据的像素点范围,例如,可以预先设定空白图像的尺寸为512*512,即所述空白图像的横坐标和纵坐标分别包含512个像素点信息,而随机生成的目标字母图像的字体大小为300,即所述目标字母图像在所述空白图像的横坐标和纵坐标上将分别占据300个像素点信息,具体的,可以将通过计算所述空白图像的尺寸和目标字母图像的字体大小:x:(0~(512-300))y:(0~(512-300)),来分别得到所述目标字母图像绘制起点位置的横坐标范围和纵坐标范围,随后将所述目标图像,随机绘制在得到的绘制起点位置范围内,得到蒙版图像,进一步确保图像信息增强过程具有一定程度的随机性,增加对原始空白图像进行数据增强的多样性,从而得到更多的增强蒙版图像。
步骤105、将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像。
将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像。
在该步骤中,可以在得到蒙版图像之后,利用蒙版图像作为图像生成模型的绘制图素,对待处理图像蒙版区域进行局部重绘,例如,在所述蒙版区域局部重绘的过程中,所述蒙版区域依据所述绘制图素,逐渐将压缩机泄露气体的目标图像数据添加到模版区域,从而得到用于进行图像识别模型训练的目标图像,所述目标图像为高仿真的压缩机气体泄露图像数据,这样一来,使得泄露气体部分为图像生成模型依据蒙版图像统一批量生成,所述蒙版图像为在图像预生成测试中仿真效果较好的绘制图素,使得生成的目标图像没有违和感,像素之间存在自然的关联,并且,与实际场景存在相符的特征,可以准确反映出压缩机泄露气体的真实情况,通过所述目标图像训练出的图像识别模型,将具备在真实场景中的强大应用能力。
此外,在本发明实施例中,对待处理图像蒙版区域进行局部重绘的过程中,在将所述蒙版图像作为局部重绘的绘制图素的基础上,还在所述图像生成模型中加入了提示词,所述提示词可以指导所述局部重绘过程,使得生成的目标图像呈现出更好地仿真效果,消除干扰图素对于图像数据的影响,实现通过所述目标图像训练出的图像识别模型,可以具备在真实场景中更强大的应用能力。
具体而言,所述将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像的过程包括如下步骤:
首先,分别按照所述正面提示词和所述负面提示词对所述图像生成模型进行参数设置。
在该步骤中,为了使得生成目标图像中,生成的泄露气体图像部分与现实场景采集的压缩机图像可以达到更好地融合效果,可以在图像生成前,加入提示词,所述正面提示词用于指导所述图像生成模型生成需要的图像特征,所述负面提示词用于防止所述图像生成模型生成不需要的图像特征,并且,可以对一些提示词中设置权重数值,以使具有权重数值提示词所对应的图像特征得到强调,这样一来,最终生成的目标图像中的泄露气体图像与压缩机图像像素之间可以具备更自然的关联,并更加具备与实际场景相符的特征,例如,在图像生成前,可以基于正面提示词:“dense smoke、(white:2.0)”和负面提示词:“(unreasonable image:1.2)、black、gray、person、window、(logo:1.2)、(text:1.2)、tags、(flame:1.2)”,对所述图像生成模型进行设置,上述提示词中,“dense smoke、black、gray、person、window、tags”设置为默认权重(即:1.0),“(white:2.0)、(unreasonableimage:1.2)、(logo:1.2)、(text:1.2)、(flame:1.2)”的权重进行了特别设置,以更好地控制目标图像生成过程,使得最终生成的目标图像数据更好地反映出压缩机气体泄露真实情况的图像特征数据。
然后,将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像。
在该步骤中,可以将随机批量生成的蒙版图像作为重采样的基础图素,以对待处理图像进行批量的蒙版区域局部图像重采样,这样一来,仅需要在现实场景中采集少量的正常压缩机图像作为待处理图像,就可以批量生成大量符合图像识别模型训练要求的高质量压缩机气体泄露图像数据,既解决了训练图像数据的问题,同时也避免了人为操作因素对图像数据仿真效果的影响。
在本实施例中,对所述待处理图像的蒙版区域进行局部图像重采样的过程中,可以应用不同的采样方法,对同样的标准图像数据进行重采样预测试,以评估各采样方法的图像收敛效果,具体为采用不同的采样方法生成相同的图像,采样步骤迭代最多40轮,以40轮的结果评估采样收敛速度,采用Euler采样方法作为多组对比的参照:A组:Euler采样方法、DDIM采样方法、PLMS采样方法、LMS Karras采样方法和Heun采样方法,其中,PLMS采样方法整体表现最差,LMS Karras采样方法略好,仅在最后几步迅速收敛,Heun采样方法由于是二阶方法,整体收敛的更快,但是计算速度上较慢;B组:各类祖先采样方法,祖先采样方法很难收敛,在期望获得稳定、可重现的结果的情况下,应当避免采用祖先采样方法;C组:DPM系列采样方法,其中,DMP fast采样方法收敛情况较差、DPM2采样方法和DPM2 Karras采样方法收敛情况优于Euler采样方法,但是代价是计算速度更慢,DPM Adapter采样方法的收敛表现最优,但是由于采用自适应的采样步骤,整体可能非常慢;D组:DPM++系列采样方法,其中,DPM++ SDE采样方法与DPM++SDE Karras采样方法的收敛能力较差,图像的波动情况较为显著,DPM++ 2M采样方法与DPM++ 2M Karras采样方法表现较好,当步数足够大时,Karras采样方法收敛的更快;E组: UniPC采样方法:UniPC采样方法的整体收敛速度慢于欧拉方法,在35步之后快速接近欧拉采样方法的表现。
另外,在目标图像生成速度方面,DPM Adaptive采样方法的收敛表现最优,但是整体的速度最慢,以Euler采样方法为代表的多数一阶方法的整体速度大致相当,以Heun采样方法为代表的二阶方法的整体耗时也基本一致,约为一阶方法的两倍,这是由于二阶求解器虽然更准确,但是由于需进行2次评估,所以在整体耗时上也翻了一倍。
经过对目标图像生成预测试的综合分析,Eula采样方法和Heun采样方法只能得到一些较为简单的图像特性,对于类似于仿真泄露气体图像特征生成效果不佳;DPM ++ SDEKarras采样方法和DDIM采样方法虽然可以得到高质量的图像数据,但会出现图像收敛不佳的情况,导致生成的图像数据会缺失必要的图像特征;DPM++ 2M Karras采样方法在生成图像数据质量和生成速度,以及重绘图像与待处理图像特征背景图像的融合效果上,则达到了一个很好的平衡。为了批量得到足够数量的高仿真气体泄露图像数据,同时综合考虑图像数据仿真效果与批量生成效率,本实施例采样方法可以优选为DPM++ 2M Karras采样方法。
最后,将所述待处理图像的蒙版区域重采样图像和所述待处理图像输入到所述参数设置后的图像生成模型,对所述蒙版区域重采样图像进行局部重绘,得到所述目标图像。
在该步骤中,在对所述待处理图像的蒙版区域的每一次采样过程中,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,控制所述蒙版图像在所述蒙版区域中的稳定扩散,并保持所述待处理图像的非蒙版区域的图像保持不变。这样一来,使得在所述预设次数重采样的过程中,逐渐减少所述待处理图像蒙版区域中需要去掉的噪声图素,逐渐增加所述待处理图像蒙版区域中需要增加的目标图素,并保持所述待处理图像的非蒙版区域保持不变,既保留了非蒙版区域从真实场景中采集到的正常压缩机特征图像数据,也在蒙版区域批量生成了高仿真的气体泄露特征图像数据,并且使两个区域的图像数据高度融合效果良好,最大限定还原了现实场景的图像特征,满足了图像识别模型对于训练数据的质量和数量要求。
具体而言,所述将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像的过程还包括如下步骤:
首先,获取噪声图素,并基于所述待处理图像的蒙版区域的位置范围,随机生成所述噪声图素的绘制起点,将所述噪声图素绘制到所述待处理图像的蒙版区域上,得到所述待处理图像的蒙版区域随机噪声图像。
在该步骤中,所述噪声图素可以是由一定数量的像素点组成的,按照预设的形状和像素点数量,形成一个像素点集合单元,其中每一个像素点的像素值可以相同或不同,并且所述像素值在((0,0,0)~(255,255,255))的范围内随机生成,再将上述像素点集合单元批量绘制到所述蒙版区域中,直到蒙版区域完全被所述噪声图素填充,得到所述待处理图像的蒙版区域随机噪声图像,例如,可以将噪声图素的形状和像素点数量预设为2*2方形,每个像素点的像素值都为(255,255,255),再将2*2方形(255,255,255)的噪声图素按照随机生成的绘制起点,绘制到所述待处理图像的蒙版区域上,得到所述待处理图像的蒙版区域随机噪声图像。
然后,依据所述蒙版图像、所述正面提示词和所述负面提示词,分别生成需要去掉的噪声图素和需要增加的目标图素。
在该步骤中,所述蒙版图像可以是一个像素点集合,其中每一个像素点的像素值可以相同或不同,并且所述像素值可以在((0,0,0)~(255,255,255))的范围内进行预先设置,为了达到最佳的图像数据仿真效果,本实施例中,将上述像素点集合中的每一个像素点的像素值预先设置为(255,255,255)。
另外,需要去掉的噪声图素和需要增加的目标图素也分别对应两个像素点集合,上述两个像素点集合在形状和像素点数量可以相同或不同,例如,需要去掉的噪声图素可以是2*2的方形像素点集合,需要增加的目标图素可以是2*3的矩形像素点集合。
然后,基于所述需要去掉的噪声元素和所述需要增加的目标图素,对所述待处理图像的蒙版区域进行采样,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,控制所述蒙版图像在所述蒙版区域中的稳定扩散,并保持所述待处理图像的非蒙版区域的图像保持不变,得到重采样迭代图像。
在该步骤中,在对所述待处理图像的蒙版区域的每一次采样过程中,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,控制所述蒙版图像在所述蒙版区域中的稳定扩散,这样一来,使得在所述预设次数重采样的过程中,逐渐减少所述待处理图像蒙版区域中需要去掉的噪声图素,逐渐增加所述待处理图像蒙版区域中需要增加的目标图素,在蒙版区域批量生成了高仿真的气体泄露特征图像数据,使所述特征图像数据最大限定还原了现实场景的图像特征,满足了图像识别模型对于训练数据的质量和数量要求。
在本实施例中,可以应用不同的采样次数,对同样的标准图像数据进行重采样预测试,以评估各采样方法的图像收敛效果和图像生成速度,由于20次的采样次数在生成图像数据质量和生成速度,以及重绘图像与待处理图像特征背景图像的融合效果上,则达到了一个很好的平衡。为了批量得到足够数量的高仿真气体泄露图像数据,同时综合考虑图像数据仿真效果与批量生成效率,本实施例重采样的预设次数可以优选为20次。
最后,依据所述蒙版图像、所述正面提示词和所述负面提示词,对所述待处理图像的蒙版区域进行预设次数的重采样,将最后一次重采样得到的所述重采样迭代图像作为所述待处理图像的蒙版区域重采样图像。
在本发明实施例中,可以在得到蒙版图像之后,利用蒙版图像作为图像生成模型的绘制图素,保持待处理图像非蒙版区域完全不变,而仅对待处理图像蒙版区域进行局部重绘,具体地,所述非蒙版区域可以包含一个正常运转的压缩机图像信息,在所述蒙版区域局部重绘的过程中,所述压缩机图像将保持不变,所述蒙版区域依据所述绘制图素,逐渐将压缩机泄露气体的目标图像数据添加到模版区域,从而得到用于进行图像识别模型训练的目标图像,所述目标图像为高仿真的压缩机气体泄露图像数据,这样一来,使得所述目标图像的压缩机区域图像数据完全和真实采集的图像数据保持一致,而泄露气体部分为图像生成模型依据蒙版图像统一批量生成,所述蒙版图像为在图像预生成测试中仿真效果较好的绘制图素,使得生成的目标图像没有违和感,像素之间存在自然的关联,并且,与实际场景存在相符的特征,可以准确反映出压缩机泄露的真实情况,通过所述目标图像训练出的图像识别模型,将具备在真实场景中的强大应用能力。
此外,在本发明实施例中,在保持待处理图像非蒙版区域完全不变,而仅对待处理图像蒙版区域进行局部重绘的过程中,在将所述蒙版图像作为局部重绘的绘制图素的基础上,还在所述图像生成模型中加入了提示词,所述提示词可以指导所述局部重绘过程,使得生成的目标图像呈现出更好地仿真效果,消除干扰图素对于图像数据的影响,实现通过所述目标图像训练出的图像识别模型,可以具备在真实场景中更强大的应用能力。
本发明提供了一种油气站压缩机气体泄露图像生成方法,包括:获取待处理图像,基于预设字母形式,随机生成目标字母图像,按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像,将蒙版图像作为图像绘制的基础图素,基于提示词对蒙版区域进行局部重绘,生成目标图像。
图2是本发明实施例提供的一种油气站压缩机气体泄露图像生成装置的框图,如图2所示,该装置可以包括:
待处理图像获取模块201,用于获取待处理图像,所述待处理图像包含特定背景特征,所述特定背景特征为压缩机区域图像;
待处理图像区域划分模块202,用于依据特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域;
字母图像生成模块203,用于基于预设字母形式,随机生成目标字母图像,所述预设字母形式至少包括目标字母、字母字体和字母字体大小;
蒙版图像生成模块204,用于创建目标尺寸的空白图像,基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像;
目标图像生成模块205,用于将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像。
可选地,所述待处理图像获取模块201,包括:
原始图像获取子模块,用于获取原始图像,所述原始图像包含至少一个所述特定背景特征;
尺寸调整子模块,用于以所述目标尺寸为目标,调整所述原始图像的尺寸,得到所述待处理图像;
可选地,所述字母图像生成模块203,包括:
字母形式集合获取子模块,用于获取字母形式集合,所述字母形式集合至少包括字母集合、字母字体集合以及字体大小区间;
目标字母选取子模块,用于基于所述字母集合,随机选取属于所述字母集合的任意一个字母,作为所述目标字母;
字母形式生成子模块,用于基于所述字母字体集合以及所述字体大小区间,随机生成所述目标字母对应的字母字体以及字母字体大小,得到所述预设字母形式;
目标字母调整子模块,用于按照所述预设字母形式对所述目标字母进行调整,生成所述目标字母图像。
可选地,所述蒙版图像生成模块204,包括:
差值计算子模块,用于对所述目标尺寸和所述字母字体大小做差值计算,得到所述目标字母图像的起点位置的最大坐标值;
起点范围获取子模块,用于获取所述目标字母图像的起点位置范围,所述起点位置范围的坐标值为坐标原点到所述起点位置的最大坐标值;
绘制起点生成子模块,用于基于所述起点位置范围,随机生成所述目标字母图像的绘制起点,作为所述目标字母图像的起点位置;
绘制子模块,用于将所述目标字母图像绘制到所述空白图像上,得到所述蒙版图像,所述目标字母图像起点位置的坐标与所述目标字母图像的顶点或中心点的坐标相同。
可选地,目标图像生成模块205,包括:
参数设置子模块,用于分别按照所述正面提示词和所述负面提示词对所述图像生成模型进行参数设置,所述正面提示词用于指导所述图像生成模型生成需要的图像特征,所述负面提示词用于防止所述图像生成模型生成不需要的图像特征;
重采样子模块,用于将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像;
局部重绘子模块,用于将所述待处理图像的蒙版区域重采样图像和所述待处理图像输入到所述参数设置后的图像生成模型,对所述蒙版区域重采样图像进行局部重绘,得到所述目标图像。
噪声图素获取子模块,用于获取噪声图素,并基于所述待处理图像的蒙版区域的位置范围,随机生成所述噪声图素的绘制起点;
噪声图像生成子模块,用于将所述噪声图素绘制到所述待处理图像的蒙版区域上,得到所述待处理图像的蒙版区域随机噪声图像;
图素调整子模块,用于依据所述蒙版图像、所述正面提示词和所述负面提示词,分别生成需要去掉的噪声图素和需要增加的目标图素;
重采样迭代子模块,用于基于所述需要去掉的噪声元素和所述需要增加的目标图素,对所述待处理图像的蒙版区域进行采样,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,控制所述蒙版图像在所述蒙版区域中的稳定扩散,并保持所述待处理图像的非蒙版区域的图像保持不变,得到重采样迭代图像;
重采样输出子模块,用于依据所述蒙版图像、所述正面提示词和所述负面提示词,对所述待处理图像的蒙版区域进行预设次数的重采样,将最后一次重采样得到的所述重采样迭代图像作为所述待处理图像的蒙版区域重采样图像。
重采样控制子模块,用于在所述预设次数重采样的过程中,逐渐减少所述待处理图像蒙版区域中需要去掉的噪声图素,逐渐增加所述待处理图像蒙版区域中需要增加的目标图素,并保持所述待处理图像的非蒙版区域保持不变。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
优选的,本发明实施例还提供一种电子设备,图3是本发明实施例提供的一种电子设备的框图,如图3所示,该电子设备可以包括处理器,存储器,存储在存储器上并可在所述处理器上运行的计算机程序、代码集或指令集,该计算机程序、代码集或指令集被处理器执行时实现上述油气站压缩机气体泄露图像生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机存储介质,介质上存储有程序,该程序被处理器执行时实现上述油气站压缩机气体泄露图像生成方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的油气站压缩机气体泄露图像生成方法不与任何特定计算机、虚拟系统或者其它电子设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的电子设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个电子设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者电子设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的油气站压缩机气体泄露图像生成方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的电子设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (10)

1.一种油气站压缩机气体泄露图像生成方法,其特征在于,所述方法包括:
获取待处理图像,所述待处理图像包含特定背景特征,所述特定背景特征为压缩机区域图像;
依据所述特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域;
基于预设字母形式,随机生成目标字母图像,所述预设字母形式至少包括目标字母、字母字体和字母字体大小;
创建目标尺寸的空白图像,基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像;
将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像。
2.根据权利要求1所述的油气站压缩机气体泄露图像生成方法,其特征在于,所述获取待处理图像,包括:
获取原始图像,所述原始图像包含至少一个所述特定背景特征;
以所述目标尺寸为目标,调整所述原始图像的尺寸,得到所述待处理图像。
3.根据权利要求1所述的油气站压缩机气体泄露图像生成方法,其特征在于,所述基于预设字母形式,随机生成目标字母图像,包括:
获取字母形式集合,所述字母形式集合至少包括字母集合、字母字体集合以及字体大小区间;
基于所述字母集合,随机选取属于所述字母集合的任意一个字母,作为所述目标字母;
基于所述字母字体集合以及所述字体大小区间,随机生成所述目标字母对应的字母字体以及字母字体大小,得到所述预设字母形式;
按照所述预设字母形式对所述目标字母进行调整,生成所述目标字母图像。
4.根据权利要求1所述的油气站压缩机气体泄露图像生成方法,其特征在于,所述基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像,包括:
对所述目标尺寸和所述字母字体大小做差值计算,得到所述目标字母图像的起点位置的最大坐标值;
获取所述目标字母图像的起点位置范围,所述起点位置范围的坐标值为坐标原点到所述起点位置的最大坐标值;
基于所述起点位置范围,随机生成所述目标字母图像的绘制起点,作为所述目标字母图像的起点位置;
将所述目标字母图像绘制到所述空白图像上,得到所述蒙版图像。
5.根据权利要求1所述的油气站压缩机气体泄露图像生成方法,其特征在于,所述提示词包括正面提示词和负面提示词,所述将所述待处理图像、所述蒙版图像和所述提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,包括:
分别按照所述正面提示词和所述负面提示词对所述图像生成模型进行参数设置;
将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像;
将所述待处理图像的蒙版区域重采样图像和所述待处理图像输入到所述参数设置后的图像生成模型,对所述蒙版区域重采样图像进行局部重绘,得到所述目标图像。
6.根据权利要求5所述的油气站压缩机气体泄露图像生成方法,其特征在于,所述将所述蒙版图像作为图像重采样的基础图素,基于参数设置后的图像生成模型对所述待处理图像的蒙版区域进行局部图像重采样,得到所述待处理图像的蒙版区域重采样图像,包括:
获取噪声图素,并基于所述待处理图像的蒙版区域的位置范围,随机生成所述噪声图素的绘制起点;
将所述噪声图素绘制到所述待处理图像的蒙版区域上,得到所述待处理图像的蒙版区域随机噪声图像;
依据所述蒙版图像、所述正面提示词和所述负面提示词,分别生成需要去掉的噪声图素和需要增加的目标图素;
基于所述需要去掉的噪声元素和所述需要增加的目标图素,对所述待处理图像的蒙版区域进行采样,减少所述待处理图像蒙版区域中需要去掉的噪声图素,增加所述待处理图像蒙版区域中需要增加的目标图素,并保持所述待处理图像的非蒙版区域的图像保持不变,得到重采样迭代图像;
依据所述蒙版图像、所述正面提示词和所述负面提示词,对所述待处理图像的蒙版区域进行预设次数的重采样,将最后一次重采样得到的所述重采样迭代图像作为所述待处理图像的蒙版区域重采样图像。
7.根据权利要求6所述的油气站压缩机气体泄露图像生成方法,其特征在于,在所述预设次数重采样的过程中,逐渐减少所述待处理图像蒙版区域中需要去掉的噪声图素,逐渐增加所述待处理图像蒙版区域中需要增加的目标图素,并保持所述待处理图像的非蒙版区域保持不变。
8.一种油气站压缩机气体泄露图像生成装置,其特征在于,所述装置包括:
待处理图像获取模块,用于获取待处理图像,所述待处理图像包含特定背景特征,所述特定背景特征为压缩机区域图像;
待处理图像区域划分模块,用于依据特定背景特征,将所述待处理图像划分为蒙版区域与非蒙版区域,所述蒙版区域为所述待处理图像中不包含所述特定背景特征的图像区域,所述非蒙版区域为所述待处理图像中包含所述特定背景特征的图像区域;
字母图像生成模块,用于基于预设字母形式,随机生成目标字母图像,所述预设字母形式至少包括目标字母、字母字体和字母字体大小;
蒙版图像生成模块,用于创建目标尺寸的空白图像,基于所述目标尺寸以及所述目标字母图像,生成所述目标字母图像的起点位置,并按照所述起点位置将所述目标字母图像绘制在所述空白图像上,作为蒙版图像;
目标图像生成模块,用于将所述待处理图像、所述蒙版图像和提示词输入到图像生成模型,以将所述蒙版图像作为图像绘制的基础图素,基于所述提示词对所述蒙版区域进行局部重绘,生成目标图像,所述目标图像为在所述蒙版区域包含气体图像的待处理图像。
9.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序指令执行权利要求1至7中任一所述的油气站压缩机气体泄露图像生成方法包括的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储程序指令,所述程序指令被处理器执行时实现如权利要求1至7中任一所述的油气站压缩机气体泄露图像生成方法包括的步骤。
CN202410302788.5A 2024-03-18 2024-03-18 油气站压缩机气体泄漏图像生成方法、装置、设备及介质 Active CN117893643B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410302788.5A CN117893643B (zh) 2024-03-18 2024-03-18 油气站压缩机气体泄漏图像生成方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410302788.5A CN117893643B (zh) 2024-03-18 2024-03-18 油气站压缩机气体泄漏图像生成方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN117893643A true CN117893643A (zh) 2024-04-16
CN117893643B CN117893643B (zh) 2024-06-11

Family

ID=90652104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410302788.5A Active CN117893643B (zh) 2024-03-18 2024-03-18 油气站压缩机气体泄漏图像生成方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN117893643B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030086091A1 (en) * 2001-11-08 2003-05-08 Michele Hinnrichs Gas leak detector
WO2020033904A1 (en) * 2018-08-09 2020-02-13 The Regents Of The University Of California Method and material to acquire magnetic resonance imaging data
CN110837941A (zh) * 2018-08-15 2020-02-25 中国石油天然气股份有限公司 对油气管道进行风险预测的方法及装置
CN111210405A (zh) * 2019-12-27 2020-05-29 山东省特种设备检验研究院有限公司 一种基于红外成像的挥发性有机物泄露检测方法
CN112114656A (zh) * 2019-06-20 2020-12-22 京东方科技集团股份有限公司 基于气流的图像处理方法、装置、设备及存储介质
CN112906463A (zh) * 2021-01-15 2021-06-04 上海东普信息科技有限公司 基于图像的火情检测方法、装置、设备及存储介质
CN115372877A (zh) * 2022-07-08 2022-11-22 广州中科云图智能科技有限公司 基于无人机的变电站的避雷器泄露电流表计巡检方法
CN115661151A (zh) * 2022-12-27 2023-01-31 长江勘测规划设计研究有限责任公司 基于机器视觉高精度识别制加氢气系统泄露的方法
CN116152724A (zh) * 2023-02-21 2023-05-23 吉林大学 一种基于ai算法的可燃气体泄漏区域检测方法
CN116456168A (zh) * 2023-06-20 2023-07-18 广州科易光电技术有限公司 图像显示方法、装置、电子设备及存储介质
CN116543022A (zh) * 2023-05-09 2023-08-04 烟台艾睿光电科技有限公司 气体红外图像处理方法、气体检漏仪及存储介质
CN117523177A (zh) * 2023-11-09 2024-02-06 北京航天拓扑高科技有限责任公司 一种基于人工智能混合大模型的燃气管道监测系统和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110633339A (zh) * 2018-06-06 2019-12-31 中国石油化工股份有限公司 一种基于gis的石化企业气体泄漏连续动态模拟展示方法
CN110930321A (zh) * 2019-11-06 2020-03-27 杭州恩玖软件有限公司 一种能够自动选取目标区域的蓝/绿幕数字图像抠取方法
CN111899202B (zh) * 2020-05-19 2024-03-15 武汉东智科技股份有限公司 一种视频图像中叠加时间字符的增强方法
CN116658830A (zh) * 2023-05-12 2023-08-29 中国矿业大学 一种基于无人机群协同的居民小区燃气管网泄漏巡检系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030086091A1 (en) * 2001-11-08 2003-05-08 Michele Hinnrichs Gas leak detector
WO2020033904A1 (en) * 2018-08-09 2020-02-13 The Regents Of The University Of California Method and material to acquire magnetic resonance imaging data
CN110837941A (zh) * 2018-08-15 2020-02-25 中国石油天然气股份有限公司 对油气管道进行风险预测的方法及装置
CN112114656A (zh) * 2019-06-20 2020-12-22 京东方科技集团股份有限公司 基于气流的图像处理方法、装置、设备及存储介质
CN111210405A (zh) * 2019-12-27 2020-05-29 山东省特种设备检验研究院有限公司 一种基于红外成像的挥发性有机物泄露检测方法
CN112906463A (zh) * 2021-01-15 2021-06-04 上海东普信息科技有限公司 基于图像的火情检测方法、装置、设备及存储介质
CN115372877A (zh) * 2022-07-08 2022-11-22 广州中科云图智能科技有限公司 基于无人机的变电站的避雷器泄露电流表计巡检方法
CN115661151A (zh) * 2022-12-27 2023-01-31 长江勘测规划设计研究有限责任公司 基于机器视觉高精度识别制加氢气系统泄露的方法
CN116152724A (zh) * 2023-02-21 2023-05-23 吉林大学 一种基于ai算法的可燃气体泄漏区域检测方法
CN116543022A (zh) * 2023-05-09 2023-08-04 烟台艾睿光电科技有限公司 气体红外图像处理方法、气体检漏仪及存储介质
CN116456168A (zh) * 2023-06-20 2023-07-18 广州科易光电技术有限公司 图像显示方法、装置、电子设备及存储介质
CN117523177A (zh) * 2023-11-09 2024-02-06 北京航天拓扑高科技有限责任公司 一种基于人工智能混合大模型的燃气管道监测系统和方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
""Monitoring and Detection of Combustible Gas Leakage by Using Infrared Imaging"", 《2018 IEEE INTERNATIONAL CONFERENCE ON IMAGING SYSTEMS AND TECHNIQUES (IST)》, 16 December 2018 (2018-12-16) *
孟森: ""基于U2 -Net 和VGG16 的天然气泄露检测"", 《激光与红外》, vol. 53, no. 3, 19 April 2023 (2023-04-19) *
李辉: ""基于冬小麦高光谱图像的天然气微泄漏胁迫区域提取"", 《光谱学与光谱分析》, vol. 44, no. 3, 7 March 2024 (2024-03-07) *

Also Published As

Publication number Publication date
CN117893643B (zh) 2024-06-11

Similar Documents

Publication Publication Date Title
CN106778928B (zh) 图像处理方法及装置
EP3885965B1 (en) Image recognition method based on micro facial expressions, apparatus and related device
CN109325532A (zh) 一种小样本下扩充数据集的图像处理方法
CN109815960A (zh) 基于深度学习的翻拍图像识别方法、装置、设备及介质
US11068746B2 (en) Image realism predictor
CN111860171A (zh) 一种大规模遥感图像中不规则形状目标的检测方法及系统
CN110781976B (zh) 训练图像的扩充方法、训练方法及相关装置
CN114155244B (zh) 缺陷检测方法、装置、设备及存储介质
CN114170227B (zh) 产品表面缺陷检测方法、装置、设备及存储介质
CN113837942A (zh) 基于srgan的超分辨率图像生成方法、装置、设备及存储介质
CN113139439B (zh) 一种基于人脸识别的在线学习专注度评价方法及装置
US20230082715A1 (en) Method for training image processing model, image processing method, apparatus, electronic device, and computer program product
CN110245621A (zh) 人脸识别装置及图像处理方法、特征提取模型、存储介质
CN110659702A (zh) 基于生成式对抗网络模型书法字帖评价系统及方法
CN117893643B (zh) 油气站压缩机气体泄漏图像生成方法、装置、设备及介质
EP1939796A2 (en) Data processing apparatus, data processing method data processing program and computer readable medium
CN102129700A (zh) 一种海洋背景下的红外仿真图像平台及其图像生成方法
CN116361502B (zh) 一种图像检索方法、装置、计算机设备及存储介质
CN112434763A (zh) 一种基于计算机的汉字骨架生成方法
CN113129409B (zh) 一种基于深度学习的漫画线稿上色方法
CN115063847A (zh) 一种面部图像获取模型的训练方法及装置
CN111508045B (zh) 一种图片合成的方法及装置
CN110188732B (zh) 一种基于卷积神经网络的静态手语识别方法
CN118096940A (zh) 藏文文本的数据集生成方法及系统
US12039454B2 (en) Microexpression-based image recognition method and apparatus, and related device

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant