CN118135336A - 一种应用于安全监管的图像核查方法、装置及电子设备 - Google Patents
一种应用于安全监管的图像核查方法、装置及电子设备 Download PDFInfo
- Publication number
- CN118135336A CN118135336A CN202410534965.2A CN202410534965A CN118135336A CN 118135336 A CN118135336 A CN 118135336A CN 202410534965 A CN202410534965 A CN 202410534965A CN 118135336 A CN118135336 A CN 118135336A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- scale
- feature
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000012545 processing Methods 0.000 claims abstract description 71
- 230000004927 fusion Effects 0.000 claims abstract description 67
- 238000000605 extraction Methods 0.000 claims abstract description 34
- 230000007246 mechanism Effects 0.000 claims abstract description 24
- 230000002159 abnormal effect Effects 0.000 claims abstract description 22
- 238000007635 classification algorithm Methods 0.000 claims abstract description 19
- 108091006146 Channels Proteins 0.000 claims description 95
- 239000013598 vector Substances 0.000 claims description 47
- 230000006870 function Effects 0.000 claims description 39
- 238000004422 calculation algorithm Methods 0.000 claims description 28
- 235000013305 food Nutrition 0.000 claims description 25
- 238000012986 modification Methods 0.000 claims description 24
- 230000004048 modification Effects 0.000 claims description 24
- 230000003044 adaptive effect Effects 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000012706 support-vector machine Methods 0.000 claims description 13
- 238000012795 verification Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 8
- 238000001914 filtration Methods 0.000 claims description 7
- 230000003993 interaction Effects 0.000 claims description 7
- 238000012797 qualification Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 description 32
- 238000004891 communication Methods 0.000 description 9
- 238000009826 distribution Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 9
- 238000007499 fusion processing Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 239000000203 mixture Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006872 improvement Effects 0.000 description 5
- 230000001965 increasing effect Effects 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 235000013410 fast food Nutrition 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 208000003464 asthenopia Diseases 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 208000019901 Anxiety disease Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000009429 electrical wiring Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 235000011888 snacks Nutrition 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Data Mining & Analysis (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种应用于安全监管的图像核查方法、装置及电子设备,涉及数据处理的技术领域。在该方法中,获取目标企业的待核查图像;采用预设分类算法对待核查图像进行分类,得到分类结果,分类结果包括目标图像;根据目标图像,确定目标图像对应的基础特征图;基于多尺度通道注意力机制,对基础特征图进行多尺度特征提取,得到多尺度特征图;将多尺度特征图输入至自适应特征融合网络中,得到目标图像的显著区域;计算显著区域与预设异常区域之间的相似度值;根据相似度值与预设相似度阈值之间的大小关系,判断目标企业是否整改合格。实施本申请提供的技术方案,便于提高安全监管的图像核查效率。
Description
技术领域
本申请涉及数据处理的技术领域,具体涉及一种应用于安全监管的图像核查方法、装置及电子设备。
背景技术
在现有的技术背景下,市场监管人员需要对企业的各方面设施进行安全监管。在向企业发出整改要求后,通常要求企业提交整改后的图像作为整改效果的证明,监管人员需要根据整改图像判断整改是否合格。
目前,对于这些整改图像的核查方式主要依赖于人工复查。但是,随着企业数量的不断增加和监管要求的日益严格,专业人员需要处理的整改图像数量急剧上升。每张图像都需要专业人员仔细查看,判断整改是否达到合格要求。这种人工核查的方式耗时耗力,难以应对大量图像的快速处理需求,极大地影响了图像核查效率。
因此,急需一种应用于安全监管的图像核查方法、装置及电子设备。
发明内容
本申请提供了一种应用于安全监管的图像核查方法、装置及电子设备,便于提高安全监管的图像核查效率。
在本申请的第一方面提供了一种应用于安全监管的图像核查方法,所述方法包括:获取目标企业的待核查图像,所述待核查图像为所述目标企业经整改之后拍摄的图像;采用预设分类算法对所述待核查图像进行分类,得到分类结果,所述分类结果包括目标图像,所述目标图像对应的类别为消防类图像、食品类图像以及电气类图像中的任意一种类别;根据所述目标图像,确定所述目标图像对应的基础特征图;基于多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域;计算所述显著区域与预设异常区域之间的相似度值,所述预设异常区域由不满足合格条件的整改图像确定;根据所述相似度值与预设相似度阈值之间的大小关系,判断所述目标企业是否整改合格。
通过采用上述技术方案,通过自动化处理,该流程极大地提高了核查图像的效率。相比传统的人工核查方式,这种方法能够在短时间内处理大量图像,减少了人工审核所需的时间成本,使得监管人员能够更高效地处理其他重要任务。人工核查过程中,由于视觉疲劳、理解差异等因素,往往会出现误判或漏判的情况。而自动化流程则基于预设算法和模型,能够客观、一致地处理图像,减少人为因素带来的误差,提高核查结果的准确性。通过多尺度通道注意力机制和自适应特征融合网络,该流程能够自动提取图像中的关键特征,并确定显著区域。这种智能化的特征提取方式能够更精确地捕捉到图像中的关键信息,为后续的相似度计算提供有力的支持。由此,便于提高安全监管的图像核查效率。
可选地,所述获取目标企业的待核查图像,具体包括:接收用户设备发送的原始图像数据;对所述原始图像数据进行预处理,得到所述目标企业的待核查图像,所述预处理包括去噪处理、滤波处理以及融合处理。
通过采用上述技术方案,通过去噪处理和滤波处理,可以有效去除原始图像数据中的噪声和干扰信息,使得图像更加清晰、平滑。这对于后续的图像分类、特征提取等操作至关重要,可以提高这些操作的准确性和稳定性。预处理过程中的融合处理能够将多张相关图像或者不同视角的图像进行有效融合,从而得到更全面、更准确的待核查图像。这种融合处理不仅可以减少后续处理的复杂性,还能提高整体数据处理效率。原始图像数据中可能包含大量的冗余信息,例如重复的像素、不必要的背景等。通过预处理操作,可以去除这些冗余信息,减少数据存储空间的需求,同时加快数据传输和处理的速度。预处理操作可以使得后续使用的分类算法、特征提取算法等更加稳定可靠。通过对原始图像数据进行适当的预处理,可以减少算法对图像质量、光照条件等因素的敏感性,进一步提高算法的鲁棒性和泛化能力。
可选地,所述预设分类算法具体采用如下计算公式:
;
其中,f(x)为分类函数,x为特征向量,xi为支持向量,n为支持向量xi的数量,ai *为拉格朗日参数,yi为类别标记,kmix(x,xi)为支持向量机的核函数,b*为分类阈值。
通过采用上述技术方案,支持向量机在处理高维数据时表现出色,能够处理大规模数据集,并且具有较高的计算效率。这使得该算法非常适合处理待核查图像中的复杂特征,并且可以在相对短的时间内完成分类任务。支持向量机在训练过程中通过优化拉格朗日参数来确定分类函数,从而使得分类结果更加准确。通过合理地选择核函数和调整参数,可以最大化分类的准确性,并且能够有效地处理噪声和异常数据。支持向量机提供了清晰的分类决策边界,使得分类结果具有较好的可解释性。这对于监管人员来说非常重要,可以帮助他们理解分类结果背后的原理,并做出相应的决策。
可选地,所述基于多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图,具体包括:对所述基础特征图对应的原始通道进行切分,得到多个子通道;利用多尺度卷积算法对多个子通道各对应的特征图进行特征提取,得到所述多尺度特征图,所述多尺度特征图为不同尺度上的特征图。
通过采用上述技术方案,通过对基础特征图对应的原始通道进行切分,得到多个子通道,每个子通道都包含了原始特征的一部分信息。这种方式有助于从多个角度和层面提取特征,增加了特征的多样性,有助于后续的分类或识别任务。利用多尺度卷积算法对多个子通道的特征图进行特征提取,可以获取到不同尺度上的特征信息。在图像处理中,不同尺度的特征往往对应着不同层次的信息,有些特征可能在较大的尺度上更为显著,而有些则可能在较小的尺度上更为明显。通过多尺度卷积,能够同时捕捉到这些不同尺度的特征,从而更全面地描述图像内容。由于多尺度特征提取能够捕捉到图像中不同尺度的信息,这使得模型对于不同大小、形状或位置的物体都能有较好的识别能力。即使物体在图像中的尺度发生变化,模型也能通过多尺度特征进行准确识别,从而提高了模型的鲁棒性。通过通道注意力机制,模型可以自动学习不同通道之间的依赖关系,并根据重要程度为不同通道分配不同的计算资源。这样可以使模型更加专注于对分类或识别任务有益的特征,提高了计算效率。由于多尺度特征提取能够更全面地描述图像内容,并且通道注意力机制能够优化计算资源的分配,这使得基于这种方法的模型在分类、识别等任务上通常能够取得更好的性能。
可选地,在所述将所述多尺度特征图输入至自适应特征融合网络中之前,所述方法还包括:提取目标尺度上的特征图的通道注意力,得到所述目标尺度上的特征图的通道注意力向量,所述目标尺度上的特征图为所述多尺度特征图中的任意一种特征图;对所述目标尺度上的特征图的通道注意力向量进行特征重新标定,结合Softmax函数,得到目标注意力权重,所述目标注意力权重为所述多尺度通道交互之后的注意力权重。
通过采用上述技术方案,通过提取目标尺度上的特征图的通道注意力,模型可以更加关注对分类或识别任务有用的特征,忽略不相关或噪声信息。这有助于模型更加精确地识别目标物体,提高了特征的针对性和有效性。在特征提取过程中,不同的通道可能包含不同重要性的信息。通过计算通道注意力向量,模型可以根据通道的重要性自动调整计算资源的分配,使得重要的通道得到更多的关注和处理,提高了计算效率和模型性能。多尺度特征图包含了不同尺度的特征信息,但直接将这些特征进行融合可能并不总是最优的。通过对目标尺度上的特征图进行通道注意力提取和特征重新标定,可以使得不同尺度的特征在融合时更加协调和有效,提高了融合后的特征质量。Softmax函数能够将原始的评分或权重转换为概率分布,使得不同尺度的特征在融合时能够有一个明确的权重分配。这有助于模型更加灵活地处理不同尺度的特征信息,提高了模型的泛化能力和鲁棒性。通过对多尺度特征图进行通道注意力提取和特征重新标定,并结合Softmax函数进行权重计算,可以使得模型在后续的分类或识别任务中取得更好的性能。模型能够更准确地捕捉到目标物体的特征信息,提高了识别的准确性和可靠性。
可选地,所述将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域,具体包括:将所述目标注意力权重和所述目标尺度上的特征图输入至所述自适应特征融合网络中,并按照预设融合算法进行加权融合,以得到所述目标图像的显著区域。
通过采用上述技术方案,通过引入目标注意力权重,模型能够在融合多尺度特征图时更加关注与目标图像显著区域相关的特征。这使得模型能够更准确地定位并突出显示显著区域,提高了显著区域检测的准确性。自适应特征融合网络能够根据输入特征的特点自适应地调整融合策略。通过将目标注意力权重与目标尺度上的特征图一同输入到网络中,模型可以更加有效地融合不同尺度的特征信息,避免了简单叠加或平均导致的信息冗余或丢失,从而优化了特征融合效果。通过明确地将目标注意力权重应用于特征融合过程,模型的决策过程变得更加透明和可解释。这有助于研究人员和用户更好地理解模型是如何识别并突出显示显著区域的,增强了模型的解释性。由于自适应特征融合网络能够灵活地处理不同尺度的特征信息,并根据注意力权重进行加权融合,这使得模型在面对不同场景、不同尺寸的目标图像时都能保持较好的性能。因此,该步骤有助于进一步地提升模型的泛化能力和鲁棒性。
可选地,所述根据所述相似度值与预设相似度阈值之间的大小关系,判断所述目标企业是否整改合格,具体包括:若确定所述相似度值大于或等于所述预设相似度阈值,则确定所述目标企业整改不合格;若确定所述相似度值小于所述预设相似度阈值,则确定所述目标企业整改合格。
通过采用上述技术方案,通过设定一个预设相似度阈值,可以为判断目标企业是否整改合格提供一个明确的、可量化的标准。这有助于避免主观判断或模糊界限导致的误判,提高了判断的准确性和公正性。预设相似度阈值可以根据实际情况进行调整。面对不同的整改要求和标准,通过调整阈值可以灵活地适应各种情况,确保判断逻辑与整改目标保持一致。判断逻辑简单明了,通过比较相似度值与预设阈值的大小关系,就能快速得出目标企业是否整改合格的结论。这种直观易懂的方式有助于减少沟通成本,提高工作效率。由于判断逻辑是基于数值比较,因此可以很容易地将其嵌入到自动化系统中。这样,系统就可以自动处理大量的数据,快速判断多个目标企业的整改情况,大大提高了工作效率。通过定期或不定期地检查目标企业的相似度值,并依据预设阈值进行整改合格性的判断,可以促使企业不断改进自身的运营和管理,以达到更高的整改标准。这有助于推动整个行业的持续进步和发展。
在本申请的第二方面提供了一种应用于安全监管的图像核查装置,所述图像核查装置包括获取模块和处理模块,其中,所述获取模块,用于获取目标企业的待核查图像,所述待核查图像为所述目标企业经整改之后拍摄的图像;所述处理模块,用于采用预设分类算法对所述待核查图像进行分类,得到分类结果,所述分类结果包括目标图像,所述目标图像对应的类别为消防类图像、食品类图像以及电气类图像中的任意一种类别;所述处理模块,还用于根据所述目标图像,确定所述目标图像对应的基础特征图;所述处理模块,还用于基于多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;所述处理模块,还用于将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域;所述处理模块,还用于计算所述显著区域与预设异常区域之间的相似度值,所述预设异常区域由不满足合格条件的整改图像确定;所述处理模块,还用于根据所述相似度值与预设相似度阈值之间的大小关系,判断所述目标企业是否整改合格。
在本申请的第三方面提供了一种电子设备,所述电子设备包括处理器、存储器、用户接口以及网络接口,所述存储器用于存储指令,所述用户接口和所述网络接口均用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如上所述的方法。
在本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如上所述的方法。
综上所述,本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1.通过自动化处理,该流程极大地提高了核查图像的效率。相比传统的人工核查方式,这种方法能够在短时间内处理大量图像,减少了人工审核所需的时间成本,使得监管人员能够更高效地处理其他重要任务。人工核查过程中,由于视觉疲劳、理解差异等因素,往往会出现误判或漏判的情况。而自动化流程则基于预设算法和模型,能够客观、一致地处理图像,减少人为因素带来的误差,提高核查结果的准确性。通过多尺度通道注意力机制和自适应特征融合网络,该流程能够自动提取图像中的关键特征,并确定显著区域。这种智能化的特征提取方式能够更精确地捕捉到图像中的关键信息,为后续的相似度计算提供有力的支持。由此,便于提高安全监管的图像核查效率;
2.通过提取目标尺度上的特征图的通道注意力,模型可以更加关注对分类或识别任务有用的特征,忽略不相关或噪声信息。这有助于模型更加精确地识别目标物体,提高了特征的针对性和有效性。在特征提取过程中,不同的通道可能包含不同重要性的信息。通过计算通道注意力向量,模型可以根据通道的重要性自动调整计算资源的分配,使得重要的通道得到更多的关注和处理,提高了计算效率和模型性能。多尺度特征图包含了不同尺度的特征信息,但直接将这些特征进行融合可能并不总是最优的。通过对目标尺度上的特征图进行通道注意力提取和特征重新标定,可以使得不同尺度的特征在融合时更加协调和有效,提高了融合后的特征质量。Softmax函数能够将原始的评分或权重转换为概率分布,使得不同尺度的特征在融合时能够有一个明确的权重分配。这有助于模型更加灵活地处理不同尺度的特征信息,提高了模型的泛化能力和鲁棒性。通过对多尺度特征图进行通道注意力提取和特征重新标定,并结合Softmax函数进行权重计算,可以使得模型在后续的分类或识别任务中取得更好的性能。模型能够更准确地捕捉到目标物体的特征信息,提高了识别的准确性和可靠性。
附图说明
图1为本申请实施例提供的一种应用于安全监管的图像核查方法的流程示意图。
图2为本申请实施例提供的一种应用于安全监管的图像核查方法的另一流程示意图。
图3为本申请实施例提供的一种应用于安全监管的图像核查装置的模块示意图。
图4为本申请实施例提供的一种电子设备的结构示意图。
附图标记说明:31、获取模块;32、处理模块;41、处理器;42、通信总线;43、用户接口;44、网络接口;45、存储器。
具体实施方式
为了使本领域的技术人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。
在本申请实施例的描述中,“例如”或者“举例来说”等词用于表示作例子、例证或说明。本申请实施例中被描述为“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
在本申请实施例的描述中,术语“多个”的含义是指两个或两个以上。例如,多个系统是指两个或两个以上的系统,多个屏幕终端是指两个或两个以上的屏幕终端。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在当前的技术发展背景下,市场监管人员肩负着对企业各类设施进行安全监管的重要职责。当向企业提出整改要求后,往往需要企业提交整改后的图像,以证明其整改的效果。
然而,目前对于这些整改图像的核查主要依赖于人工进行复查。但随着企业数量的迅速增长和监管标准的日益严格,监管人员需要处理的整改图像数量呈现出爆炸式的增长。每张图像都需要专业人员细致入微地查看,以判断整改是否达到了既定的要求。这种依赖人工的核查方式不仅耗时费力,而且难以应对大量图像快速处理的需求,严重制约了图像核查的效率。
为了解决上述技术问题,本申请提供了一种应用于安全监管的图像核查方法,参照图1,图1为本申请实施例提供的一种应用于安全监管的图像核查方法的流程示意图。该图像核查方法应用于服务器,包括步骤S110至步骤S170,上述步骤如下:
S110、获取目标企业的待核查图像,待核查图像为目标企业经整改之后拍摄的图像。
具体地,服务器是一个计算设备,它负责处理、存储和传输数据。在这个场景中,服务器负责获取图像数据,服务器对应着专业监管人员的计算机设备。目标企业指的是需要进行整改并接受核查的特定企业或组织。整改指的是企业或组织在某一方面(如环境、安全、管理等)存在不足或违规,因此需要进行相应的调整或改进,以满足相关标准或要求。待核查图像是在整改之后拍摄的,用于记录整改后的状况。它们通常用于与整改前的图像或标准图像进行对比,以验证整改是否有效、是否符合要求。
举例来说,某知名快餐店因为食品安全问题被曝光。据报道,该快餐店的食材存储不当,导致部分食材过期变质。同时,店内卫生状况也堪忧,存在员工操作不规范、清洁不彻底等问题。这些问题被消费者和监管部门发现后,引发了广泛关注和讨论。针对这些问题,该快餐店迅速采取了整改措施。首先,对过期变质的食材进行了清理,并加强了对食材存储和保质期的管理。其次,加强了对员工的培训,确保他们严格遵守食品安全操作规程。同时,店内也进行了全面的清洁和消毒工作,提高了整体卫生水平。上述步骤完成后,该快餐店会将相关整改资料上传至服务器,以供监管部门的监管人员审核。
在一种可能的实施方式中,获取目标企业的待核查图像,具体包括:接收用户设备发送的原始图像数据;对原始图像数据进行预处理,得到目标企业的待核查图像,预处理包括去噪处理、滤波处理以及融合处理。
具体地,用户设备(如手机、相机等)拍摄目标企业整改后的现场图像,并将这些图像数据发送至服务器。服务器接收这些未经处理的原始图像数据,准备进行后续的处理。原始图像数据中可能包含各种噪声,如由于拍摄设备、环境光线或传输过程中产生的噪声。去噪处理的目的就是减少或消除这些噪声,使图像更加清晰。滤波处理用于增强图像的边缘信息,减少图像的模糊,使图像中的细节更加突出。如果原始图像数据包含多张图像(例如,从不同角度或距离拍摄的图像),融合处理可以将这些图像合并成一张更加全面、信息更丰富的图像。经过上述预处理步骤后,原始图像数据被转化为更加清晰、信息更加突出的待核查图像。这些待核查图像随后可以用于与整改前的图像或其他标准图像进行对比,以评估整改效果。
举例来说,假设一家餐饮企业因为卫生问题被要求整改。整改完成后,卫生监管部门的监管人员使用手机拍摄了整改后的厨房环境,包括灶台、餐具摆放、地面清洁等多个方面的图像,并将这些图像上传至服务器。服务器接收到这些原始图像数据后,首先进行去噪处理,消除由于拍摄环境或设备产生的噪点,使图像更加清晰。接着,进行滤波处理,增强图像的边缘信息,使厨房内的各种物品和细节更加突出。最后,如果拍摄了多张不同角度的图像,服务器会进行融合处理,将这些图像合并成一张全面的厨房环境图像。经过这些预处理步骤后,服务器得到了餐饮企业的待核查图像。这些图像随后可以被卫生监管部门用于与整改前的图像进行对比,以验证整改是否到位,是否达到了卫生标准。
S120、采用预设分类算法对待核查图像进行分类,得到分类结果,分类结果包括目标图像,目标图像对应的类别为消防类图像、食品类图像以及电气类图像中的任意一种类别。
具体地,预设分类算法是一种预先设定好的图像分类算法,它可以根据图像的特征将其归入不同的类别。这种算法基于支持向量机技术,通过训练大量样本数据来学习不同类别图像的特征。待核查图像包含了多种不同类别的信息,需要进行分类以便后续的核查或分析。使用预设分类算法对待核查图像进行分类后,会得到一个分类结果。这个结果指明了图像所属的类别。在这个场景中,分类算法可以将图像分为多个类别,包括消防类图像、食品类图像以及电气类图像等。这些类别是基于图像的内容和特征来确定的,例如消防类图像可能包含消防设备、消防通道等元素,食品类图像可能包含食品加工、存储等环节,电气类图像可能涉及电气设备、线路等。
举例来说,假设一个大型商场需要进行安全检查,商场内的不同区域(如餐饮区、电气控制室、消防通道等)拍摄了大量的待核查图像,并上传至服务器进行分类。服务器使用预设的分类算法对这些图像进行自动分类。对于一张显示消防设备的图像,算法会识别出其中的消防设备、消防标识等特征,并将其归类为消防类图像。对于一张展示食品加工过程的图像,算法会识别出食品、加工设备等元素,将其归类为食品类图像。同样,对于展示电气设备或线路的图像,算法会将其归类为电气类图像。在分类结果中,某些图像可能因为特定的安全问题或隐患而被标记为目标图像,需要特别关注。例如,一张显示消防通道被堵塞的图像,或者一张显示电气设备老化的图像,都可能被标记为目标图像,并需要进一步的分析和处理。通过这样的分类过程,商场管理人员可以更加高效地识别出不同类别的安全问题,并采取相应的措施进行整改,确保商场的安全运营。
在一种可能的实施方式中,预设分类算法具体采用如下计算公式:
;
其中,f(x)为分类函数,x为特征向量,xi为支持向量,n为支持向量xi的数量,ai *为拉格朗日参数,yi为类别标记,kmix(x,xi)为支持向量机的核函数,b*为分类阈值。
具体地,f(x)表示分类函数,即用来对输入特征向量x进行分类的函数。
x代表输入的特征向量,这是待分类的数据。xi是支持向量,它们是训练数据中最靠近分类边界的数据点。n是支持向量xi的数量,表示训练数据中用于构建分类边界的支持向量的个数。ai *是拉格朗日参数,用于调整支持向量在分类中的重要性。yi是类别标记,表示对应于支持向量xi的类别标签。kmix(x,xi)是支持向量机的核函数,用于衡量特征向量x与支持向量xi之间的相似度。b*是分类阈值,用于决定特征向量x所属的类别。该公式实际上是在描述一个基于支持向量机的分类器,其中通过求解最优化问题,得到一组最优的拉格朗日参数ai和分类阈值b*,以及选择适当的核函数kmix(x,xi)来构建分类函数f(x)。
举例来说,假设有一个图像数据集,其中包含了各种类型的图像,包括食品类、消防类和电气类图像。每张图像都被表示为一个特征向量x,其中包含了图像的各种特征,比如颜色、纹理等。现在,想要利用支持向量机分类器来对这些图像进行分类。首先,可以将特征向量x表示为图像的像素值、颜色直方图、纹理特征等。然后,需要确定支持向量xi,它们是训练数据中最靠近分类边界的数据点,以及类别标记yi。假设已经通过训练得到了一组最优的拉格朗日参数ai和分类阈值b*,并且选择了适当的核函数kmix(x,xi)来构建分类函数f(x)。
现在,有一张新的待分类的图像,则可以利用构建好的分类函数f(x)来对这张图像进行分类。具体步骤如下:将待分类的图像表示为特征向量x。将特征向量x输入到分类函数f(x)中,得到分类结果。根据分类结果,确定待分类图像属于食品类、消防类还是电气类。例如,假设有一张待分类的图像,表示为特征向量x,经过支持向量机分类器的分类函数f(x)处理后,得到的分类结果为消防类。这就意味着这张图像被分类为消防类图像。通过这种方式,可以实现利用支持向量机分类器对食品类、消防类和电气类图像进行分类,实现对图像的自动分类和识别。
S130、根据目标图像,确定目标图像对应的基础特征图。
具体地,基础特征图是对目标图像进行特征提取后得到的结果,它包含了图像中的关键特征信息。这些特征可以是颜色、形状、纹理、边缘等,它们能够描述图像的基本属性和内容。服务器通过对目标图像进行特征提取和分析,从而得到其对应的基础特征图。这个过程可以涉及图像处理、特征检测、机器学习等多种技术。
举例来说,假设服务器在处理一家工厂的安全检查图像时,通过分类算法识别出一张电气类图像作为目标图像。这张图像显示了一个电气控制柜和一些相关的电气线路。为了进一步分析这张图像,服务器需要确定其对应的基础特征图。它可能会利用图像处理技术来提取图像中的边缘信息,标识出电气设备的轮廓;同时,它也可能分析图像中的颜色、纹理等特征,以便更好地描述电气设备的状态。通过这些特征提取和分析,服务器最终生成了目标图像的基础特征图。这张特征图可能突出了电气设备的关键部件、异常状态或潜在风险,为后续的安全评估和整改提供了重要的参考信息。总的来说,服务器根据目标图像确定其对应的基础特征图,是为了进一步分析和理解图像内容,提取关键信息,从而为后续的决策和处理提供支持。
S140、基于多尺度通道注意力机制,对基础特征图进行多尺度特征提取,得到多尺度特征图。
具体地,多尺度通道注意力机制是一种特殊的图像处理机制,它结合了多尺度处理和通道注意力机制来增强特征提取的效果。多尺度处理意味着在不同的空间尺寸或分辨率上分析图像,以便捕获不同尺度的特征信息。通道注意力机制则关注于为每个通道(即颜色或特征通道)分配不同的权重,强调对任务贡献更大的通道,同时抑制无关紧要的通道。通过使用多尺度通道注意力机制,服务器能够在多个尺度上分析基础特征图,提取出不同尺度的特征。这样做有助于捕捉图像中不同大小的物体、结构或模式,提高特征表达的丰富性和准确性。经过多尺度特征提取后,服务器生成多尺度特征图。这些特征图不仅包含了基础特征图的信息,还增加了不同尺度的特征信息,使得后续的任务(如分类、检测等)能够更准确地理解图像内容。
举例来说,假设监管部门正在对一家大型商场的消防设备进行图像核查,特别是关注消防栓和灭火器的情况。多尺度特征图将帮助监管人员获取不同尺度的关键信息。在小尺度特征图中,可以关注到消防设备的详细特征和细节。例如,对于消防栓,小尺度特征图突出显示消防栓的出水口、阀门、连接管等细节部分,以及它们是否完整、无损坏。对于灭火器,小尺度特征图强调压力指示器的状态、安全销是否在位、灭火器的标签和标识是否清晰可见等。
在中尺度特征图中,可以关注消防设备与其周围环境的关系,以及设备在整体布局中的位置。例如,对于消防栓,中尺度特征图展示消防栓周围的通道是否畅通、是否被障碍物阻挡,以及消防栓的间距是否符合规定。对于灭火器,中尺度特征图展示灭火器在商场内的分布是否均匀,以及是否放置在易于取用的位置。
在大尺度特征图中,可以关注消防设备在整个商场的宏观布局和分布情况。大尺度特征图可能展示商场的楼层平面图,标注出消防栓和灭火器的位置,以及它们相对于其他安全设施(如疏散通道、安全出口)的位置关系。这样的特征图有助于评估商场的消防安全布局是否合理,以及是否存在潜在的消防安全风险。通过综合不同尺度的特征图,可以全面评估商场的消防安全状况。小尺度特征图提供了设备细节的信息,中尺度特征图展示了设备与周围环境的关系,大尺度特征图则提供了整体布局的概览。这样的多尺度分析有助于监管人员发现潜在的消防安全隐患,如消防设备损坏、通道不畅等,并及时采取相应的措施进行督促整改,确保商场的消防安全。
在一种可能的实施方式中,基于多尺度通道注意力机制,对基础特征图进行多尺度特征提取,得到多尺度特征图,具体包括:对基础特征图对应的原始通道进行切分,得到多个子通道;利用多尺度卷积算法对多个子通道各对应的特征图进行特征提取,得到多尺度特征图,多尺度特征图为不同尺度上的特征图。
具体地,在图像处理中,特征图通常具有多个通道,每个通道代表了图像的一种特征(例如颜色、纹理等)。对基础特征图进行通道切分,意味着将这些通道分割成多个子通道,每个子通道包含原始特征图的一部分特征信息。多尺度卷积算法是一种能够在不同尺度上提取图像特征的方法。对每个子通道对应的特征图应用多尺度卷积算法,可以捕获到不同尺度的特征信息。这有助于提取出图像中不同大小的物体、结构或模式。经过多尺度卷积算法处理后,每个子通道都会生成对应的多尺度特征图。这些多尺度特征图包含了不同尺度上的特征信息,它们共同构成了对原始图像更全面、更细致的特征描述。
S150、将多尺度特征图输入至自适应特征融合网络中,得到目标图像的显著区域。
具体地,如前,多尺度特征图是从不同尺度(或分辨率)上提取的图像特征信息。这种特征图有助于捕捉图像中不同大小、不同尺度的物体或结构,从而提供更全面、更细致的特征描述。自适应特征融合网络是一种能够自动选择和融合不同特征信息的神经网络结构。它能够对输入的多尺度特征图进行处理,通过自适应地调整不同特征之间的权重和融合方式,生成一个更加准确、更加有用的特征表示。
在一种可能的实施方式中,在将多尺度特征图输入至自适应特征融合网络中之前,还包括:提取目标尺度上的特征图的通道注意力,得到目标尺度上的特征图的通道注意力向量,目标尺度上的特征图为多尺度特征图中的任意一种特征图;对目标尺度上的特征图的通道注意力向量进行特征重新标定,结合Softmax函数,得到目标注意力权重,目标注意力权重为多尺度通道交互之后的注意力权重。
具体地,在多尺度特征图中,每个尺度上的特征图都由多个通道组成,每个通道代表了图像的一种特征。通道注意力是指不同通道在特征表示中的重要性或权重。服务器会选择一个目标尺度上的特征图,然后利用某种通道注意力机制(如Squeeze-and-Excitation模块)来提取该特征图的通道注意力信息。这通常涉及到对特征图进行全局平均池化等操作,以得到一个能够表示通道重要性的向量。经过通道注意力提取后,服务器会得到一个与目标尺度特征图通道数相对应的向量,这个向量中的每个元素代表了对应通道的重要性或权重。特征重新标定是指根据通道注意力向量对原始特征图进行权重调整的过程。通过给不同的通道赋予不同的权重,可以强调对任务贡献较大的通道,同时抑制贡献较小的通道。为了将通道注意力向量转换为概率分布形式,并确保权重之和为1,服务器通常会使用Softmax函数对通道注意力向量进行处理。这样得到的权重更易于解释和应用。在实际应用中,多尺度特征图之间可能需要进行交互或融合,以得到更全面的特征表示,这个过程可能会涉及到不同尺度特征图之间的权重分配和特征融合,通过提取特定尺度上的通道注意力并进行重新标定,可以得到这个尺度在与其他尺度交互后的注意力权重,这里不再赘述。
在一种可能的实施方式中,将多尺度特征图输入至自适应特征融合网络中,得到目标图像的显著区域,具体包括:将目标注意力权重和目标尺度上的特征图输入至自适应特征融合网络中,并按照预设融合算法进行加权融合,以得到目标图像的显著区域。
具体地,如前,目标注意力权重是通过提取特定尺度特征图的通道注意力,并经过重新标定和Softmax函数处理得到的。这些权重反映了不同通道在特征表示中的重要性,可以用于调整特征图的贡献。自适应特征融合网络是一个能够自动选择和融合不同特征信息的神经网络结构。它可以根据输入的特征图和对应的权重,自适应地调整融合策略,从而生成一个更加准确、更加有用的特征表示。在自适应特征融合网络中,服务器会利用目标注意力权重对目标尺度上的特征图进行加权处理。这意味着,对于重要的通道,会赋予更高的权重,使其在融合过程中发挥更大的作用;而对于不重要的通道,则会赋予较低的权重,甚至可能被抑制。通过加权融合处理,自适应特征融合网络能够生成一个融合了重要特征信息的特征表示。这个特征表示能够突出显示目标图像中的显著区域,即那些对任务贡献较大、引人注目的部分。
其中,预设融合算法可以为加权求和,通过将每个通道的特征图与对应的目标注意力权重相乘,然后将所有通道的结果相加得到最终的融合特征图;预设融合算法还可以为卷积融合,通过在融合过程中引入卷积操作,可以对特征图进行进一步的特征提取和融合,这种方法可以增加网络的深度和非线性,提高特征融合的效果;预设融合算法还可以为注意力机制融合,除了使用目标注意力权重进行加权融合外,还可以引入其他类型的注意力机制(如空间注意力、自注意力等)来进一步增强特征融合的效果。具体融合算法根据实际情况设定,这里不再赘述。
举例来说,假设正在对一张食品图像进行核查,目标是识别和定位图像中的显著区域,以便进行进一步的分类或质量检测。首先,服务器提取了多尺度特征图,并从中选择了一个与目标食品大小相匹配的特征图(目标尺度上的特征图)。接着,服务器利用通道注意力机制得到了这个特征图的通道注意力权重(目标注意力权重)。然后,服务器将这些权重和特征图输入到自适应特征融合网络中。网络会根据预设的融合算法对特征图进行加权融合,强调那些与食品相关的显著特征(如颜色、纹理、形状等),同时抑制背景或其他不相关的特征。最后,经过自适应特征融合网络的处理,得到了一个突出了食品显著区域的特征表示。这个特征表示可以帮助监管人员准确地识别和定位图像中的食品,从而进行后续的分类或质量检测。通过这种方式,服务器可以利用多尺度特征图和自适应特征融合网络来有效地提取和识别食品图像中的显著区域,提高图像核查的准确性和效率。
S160、计算显著区域与预设异常区域之间的相似度值,预设异常区域由不满足合格条件的整改图像确定。
具体地,预设异常区域通常是根据一些已知的不合格或异常图像确定的。这些不合格图像可能包含了某些特定的模式或特征,使得它们不符合某种合格条件。通过分析这些不合格图像,可以定义出异常区域,这些区域通常代表了图像中不符合标准或可能存在问题的地方。相似度值是一个量化指标,用于衡量两个区域之间的相似程度。服务器通过计算显著区域与预设异常区域之间的相似度值,可以判断显著区域是否与已知的异常模式相匹配或相似。其中,计算相似度值可以采用特征匹配法,通过提取显著区域和预设异常区域的特征描述子,例如SIFT、SURF或ORB等,再通过比较这些特征描述子之间的相似度(如欧氏距离、汉明距离等),来衡量两个区域的相似性;还可以采用直方图比较法,分别计算显著区域和预设异常区域的颜色直方图或纹理直方图,通过比较两个直方图的差异(如直方图相交、卡方距离等),得到相似度值;还可以采用结构相似性度量,通过考虑显著区域和预设异常区域的结构信息,例如边缘、轮廓等,再通过比较这些结构信息的相似性,来评估两个区域的相似度。具体相似度计算方法根据实际情况设定,这里不再赘述。
S170、根据相似度值与预设相似度阈值之间的大小关系,判断目标企业是否整改合格。
在一种可能的实施方式中,参照图2,图2为本申请实施例提供的一种应用于安全监管的图像核查方法的另一流程示意图。包括步骤S210至步骤S220,上述步骤如下:根据相似度值与预设相似度阈值之间的大小关系,判断目标企业是否整改合格,具体包括:S210、若确定相似度值大于或等于预设相似度阈值,则确定目标企业整改不合格;S220、若确定相似度值小于预设相似度阈值,则确定目标企业整改合格。
具体地,在进行相似度比较后,服务器会根据相似度值与预设相似度阈值之间的大小关系,来判断目标企业的整改情况是否合格。如果相似度值低于预设相似度阈值,说明显著区域与预设异常区域的相似程度较低,即目标企业的整改情况较好,没有明显的异常或缺陷,因此可以判断为整改合格。如果相似度值高于或等于预设相似度阈值,说明显著区域与预设异常区域的相似程度较高,即目标企业的整改情况不佳,仍然存在明显的异常或缺陷,因此可以判断为整改不合格。其中,预设相似度阈值可以设定为0.5。
本申请还提供了一种应用于安全监管的图像核查装置,参照图3,图3为本申请实施例提供的一种应用于安全监管的图像核查装置的模块示意图。该图像核查装置为服务器,服务器包括获取模块31和处理模块32,其中,获取模块31获取目标企业的待核查图像,待核查图像为目标企业经整改之后拍摄的图像;处理模块32采用预设分类算法对待核查图像进行分类,得到分类结果,分类结果包括目标图像,目标图像对应的类别为消防类图像、食品类图像以及电气类图像中的任意一种类别;处理模块32根据目标图像,确定目标图像对应的基础特征图;处理模块32基于多尺度通道注意力机制,对基础特征图进行多尺度特征提取,得到多尺度特征图;处理模块32将多尺度特征图输入至自适应特征融合网络中,得到目标图像的显著区域;处理模块32计算显著区域与预设异常区域之间的相似度值,预设异常区域由不满足合格条件的整改图像确定;处理模块32根据相似度值与预设相似度阈值之间的大小关系,判断目标企业是否整改合格。
在一种可能的实施方式中,获取目标企业的待核查图像,具体包括:获取模块31接收用户设备发送的原始图像数据;处理模块32对原始图像数据进行预处理,得到目标企业的待核查图像,预处理包括去噪处理、滤波处理以及融合处理。
在一种可能的实施方式中,预设分类算法具体采用如下计算公式:
;
其中,f(x)为分类函数,x为特征向量,xi为支持向量,n为支持向量xi的数量,ai *为拉格朗日参数,yi为类别标记,kmix(x,xi)为支持向量机的核函数,b*为分类阈值。
在一种可能的实施方式中,处理模块32基于多尺度通道注意力机制,对基础特征图进行多尺度特征提取,得到多尺度特征图,具体包括:处理模块32对基础特征图对应的原始通道进行切分,得到多个子通道;处理模块32利用多尺度卷积算法对多个子通道各对应的特征图进行特征提取,得到多尺度特征图,多尺度特征图为不同尺度上的特征图。
在一种可能的实施方式中,在处理模块32将多尺度特征图输入至自适应特征融合网络中之前,还包括:处理模块32提取目标尺度上的特征图的通道注意力,得到目标尺度上的特征图的通道注意力向量,目标尺度上的特征图为多尺度特征图中的任意一种特征图;处理模块32对目标尺度上的特征图的通道注意力向量进行特征重新标定,结合Softmax函数,得到目标注意力权重,目标注意力权重为多尺度通道交互之后的注意力权重。
在一种可能的实施方式中,处理模块32将多尺度特征图输入至自适应特征融合网络中,得到目标图像的显著区域,具体包括:处理模块32将目标注意力权重和目标尺度上的特征图输入至自适应特征融合网络中,并按照预设融合算法进行加权融合,以得到目标图像的显著区域。
在一种可能的实施方式中,处理模块32根据相似度值与预设相似度阈值之间的大小关系,判断目标企业是否整改合格,具体包括:处理模块32若确定相似度值大于或等于预设相似度阈值,则确定目标企业整改不合格;处理模块32若确定相似度值小于预设相似度阈值,则确定目标企业整改合格。
需要说明的是:上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置和方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请还提供了一种电子设备,参照图4,图4为本申请实施例提供的一种电子设备的结构示意图。电子设备可以包括:至少一个处理器41,至少一个网络接口44,用户接口43,存储器45,至少一个通信总线42。
其中,通信总线42用于实现这些组件之间的连接通信。
其中,用户接口43可以包括显示屏(Display)、摄像头(Camera),可选用户接口43还可以包括标准的有线接口、无线接口。
其中,网络接口44可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器41可以包括一个或者多个处理核心。处理器41利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器45内的指令、程序、代码集或指令集,以及调用存储在存储器45内的数据,执行服务器的各种功能和处理数据。可选的,处理器41可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器41可集成中央处理器(Central ProcessingUnit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器41中,单独通过一块芯片进行实现。
其中,存储器45可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器45包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器45可用于存储指令、程序、代码、代码集或指令集。存储器45可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及的数据等。存储器45可选的还可以是至少一个位于远离前述处理器41的存储装置。如图4所示,作为一种计算机存储介质的存储器45中可以包括操作系统、网络通信模块、用户接口模块以及一种应用于安全监管的图像核查方法的应用程序。
在图4所示的电子设备中,用户接口43主要用于为用户提供输入的接口,获取用户输入的数据;而处理器41可以用于调用存储器45中存储一种应用于安全监管的图像核查方法的应用程序,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个的方法。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必需的。
本申请还提供了一种计算机可读存储介质,计算机可读存储介质存储有指令。当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所披露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其他的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践真理的公开后,将容易想到本公开的其他实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。
Claims (8)
1.一种应用于安全监管的图像核查方法,其特征在于,所述方法包括:
获取目标企业的待核查图像,所述待核查图像为所述目标企业经整改之后拍摄的图像;
采用预设分类算法对所述待核查图像进行分类,得到分类结果,所述分类结果包括目标图像,所述目标图像对应的类别为消防类图像、食品类图像以及电气类图像中的任意一种类别;
根据所述目标图像,确定所述目标图像对应的基础特征图;
基于多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;
将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域;
计算所述显著区域与预设异常区域之间的相似度值,所述预设异常区域由不满足合格条件的整改图像确定;
根据所述相似度值与预设相似度阈值之间的大小关系,判断所述目标企业是否整改合格;
在所述将所述多尺度特征图输入至自适应特征融合网络中之前,所述方法还包括:
提取目标尺度上的特征图的通道注意力,得到所述目标尺度上的特征图的通道注意力向量,所述目标尺度上的特征图为所述多尺度特征图中的任意一种特征图;
对所述目标尺度上的特征图的通道注意力向量进行特征重新标定,结合Softmax函数,得到目标注意力权重,所述目标注意力权重为所述多尺度通道交互之后的注意力权重;
所述将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域,具体包括:
将所述目标注意力权重和所述目标尺度上的特征图输入至所述自适应特征融合网络中,并按照预设融合算法进行加权融合,以得到所述目标图像的显著区域。
2.根据权利要求1所述的应用于安全监管的图像核查方法,其特征在于,所述获取目标企业的待核查图像,具体包括:
接收用户设备发送的原始图像数据;
对所述原始图像数据进行预处理,得到所述目标企业的待核查图像,所述预处理包括去噪处理、滤波处理以及融合处理。
3.根据权利要求1所述的应用于安全监管的图像核查方法,其特征在于,所述预设分类算法具体采用如下计算公式:
;
其中,f(x)为分类函数,x为特征向量,xi为支持向量,n为支持向量xi的数量,ai *为拉格朗日参数,yi为类别标记,kmix(x,xi)为支持向量机的核函数,b*为分类阈值。
4.根据权利要求1所述的应用于安全监管的图像核查方法,其特征在于,所述基于多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图,具体包括:
对所述基础特征图对应的原始通道进行切分,得到多个子通道;
利用多尺度卷积算法对多个子通道各对应的特征图进行特征提取,得到所述多尺度特征图,所述多尺度特征图为不同尺度上的特征图。
5.根据权利要求1所述的应用于安全监管的图像核查方法,其特征在于,所述根据所述相似度值与预设相似度阈值之间的大小关系,判断所述目标企业是否整改合格,具体包括:
若确定所述相似度值大于或等于所述预设相似度阈值,则确定所述目标企业整改不合格;
若确定所述相似度值小于所述预设相似度阈值,则确定所述目标企业整改合格。
6.一种应用于安全监管的图像核查装置,其特征在于,所述图像核查装置包括获取模块(31)和处理模块(32),其中,
所述获取模块(31),用于获取目标企业的待核查图像,所述待核查图像为所述目标企业经整改之后拍摄的图像;
所述处理模块(32),用于采用预设分类算法对所述待核查图像进行分类,得到分类结果,所述分类结果包括目标图像,所述目标图像对应的类别为消防类图像、食品类图像以及电气类图像中的任意一种类别;
所述处理模块(32),还用于根据所述目标图像,确定所述目标图像对应的基础特征图;
所述处理模块(32),还用于基于多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;
所述处理模块(32),还用于将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域;
所述处理模块(32),还用于计算所述显著区域与预设异常区域之间的相似度值,所述预设异常区域由不满足合格条件的整改图像确定;
所述处理模块(32),还用于根据所述相似度值与预设相似度阈值之间的大小关系,判断所述目标企业是否整改合格;
所述处理模块(32),还用于在所述将所述多尺度特征图输入至自适应特征融合网络中之前,还包括:提取目标尺度上的特征图的通道注意力,得到所述目标尺度上的特征图的通道注意力向量,所述目标尺度上的特征图为所述多尺度特征图中的任意一种特征图;对所述目标尺度上的特征图的通道注意力向量进行特征重新标定,结合Softmax函数,得到目标注意力权重,所述目标注意力权重为所述多尺度通道交互之后的注意力权重;
所述处理模块(32),还用于所述将所述多尺度特征图输入至自适应特征融合网络中,得到所述目标图像的显著区域,具体包括:将所述目标注意力权重和所述目标尺度上的特征图输入至所述自适应特征融合网络中,并按照预设融合算法进行加权融合,以得到所述目标图像的显著区域。
7.一种电子设备,其特征在于,所述电子设备包括处理器(41)、存储器(45)、用户接口(43)以及网络接口(44),所述存储器(45)用于存储指令,所述用户接口(43)和所述网络接口(44)均用于给其他设备通信,所述处理器(41)用于执行所述存储器(45)中存储的指令,以使所述电子设备执行如权利要求1至5任意一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1至5任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410534965.2A CN118135336A (zh) | 2024-04-30 | 2024-04-30 | 一种应用于安全监管的图像核查方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410534965.2A CN118135336A (zh) | 2024-04-30 | 2024-04-30 | 一种应用于安全监管的图像核查方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118135336A true CN118135336A (zh) | 2024-06-04 |
Family
ID=91235992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410534965.2A Pending CN118135336A (zh) | 2024-04-30 | 2024-04-30 | 一种应用于安全监管的图像核查方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118135336A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114266740A (zh) * | 2021-12-14 | 2022-04-01 | 芸豆数字科技有限公司 | 一种中药饮片质检方法、装置、设备及存储介质 |
CN116383791A (zh) * | 2023-03-28 | 2023-07-04 | 平安银行股份有限公司 | 一种客户身份认证方法、装置、电子设备及介质 |
CN116597422A (zh) * | 2023-06-14 | 2023-08-15 | 中瑞科技术有限公司 | 一种基于图像数据的道路预警方法、装置及电子设备 |
CN116630969A (zh) * | 2023-05-25 | 2023-08-22 | 西安康汇馨光检科技有限公司 | 一种基于显微高光谱图像的病原菌标记方法及装置 |
WO2023169582A1 (zh) * | 2022-03-11 | 2023-09-14 | 北京字跳网络技术有限公司 | 图像增强方法、装置、设备及介质 |
CN117745681A (zh) * | 2023-12-23 | 2024-03-22 | 南京北控工程检测咨询有限公司 | 一种管线缺陷的预警方法、装置及电子设备 |
CN117935154A (zh) * | 2024-01-24 | 2024-04-26 | 珩星电子(连云港)股份有限公司 | 火工品自动运输方法、系统、电子设备及可读存储介质 |
-
2024
- 2024-04-30 CN CN202410534965.2A patent/CN118135336A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114266740A (zh) * | 2021-12-14 | 2022-04-01 | 芸豆数字科技有限公司 | 一种中药饮片质检方法、装置、设备及存储介质 |
WO2023169582A1 (zh) * | 2022-03-11 | 2023-09-14 | 北京字跳网络技术有限公司 | 图像增强方法、装置、设备及介质 |
CN116383791A (zh) * | 2023-03-28 | 2023-07-04 | 平安银行股份有限公司 | 一种客户身份认证方法、装置、电子设备及介质 |
CN116630969A (zh) * | 2023-05-25 | 2023-08-22 | 西安康汇馨光检科技有限公司 | 一种基于显微高光谱图像的病原菌标记方法及装置 |
CN116597422A (zh) * | 2023-06-14 | 2023-08-15 | 中瑞科技术有限公司 | 一种基于图像数据的道路预警方法、装置及电子设备 |
CN117745681A (zh) * | 2023-12-23 | 2024-03-22 | 南京北控工程检测咨询有限公司 | 一种管线缺陷的预警方法、装置及电子设备 |
CN117935154A (zh) * | 2024-01-24 | 2024-04-26 | 珩星电子(连云港)股份有限公司 | 火工品自动运输方法、系统、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11488294B2 (en) | Method for detecting display screen quality, apparatus, electronic device and storage medium | |
CN110148130B (zh) | 用于检测零件缺陷的方法和装置 | |
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
CN108416902A (zh) | 基于差异识别的实时物体识别方法和装置 | |
CN115131283B (zh) | 目标对象的缺陷检测、模型训练方法、装置、设备及介质 | |
CN113642474A (zh) | 一种基于yolov5的危险区域人员监控方法 | |
CN110264444A (zh) | 基于弱分割的损伤检测方法及装置 | |
CN115049598A (zh) | 门店货架上摆放试用装产品规范检测方法、系统及设备 | |
CN117392042A (zh) | 缺陷检测方法、缺陷检测设备及存储介质 | |
CN116385430A (zh) | 一种机器视觉瑕疵检测方法、装置、介质及设备 | |
CN118279808B (zh) | 基于视频分析的抽查取证方法、系统、电子设备及介质 | |
CN112206541B (zh) | 游戏外挂识别方法、装置、存储介质及计算机设备 | |
CN113947560A (zh) | 产品检测方法、装置、系统和计算机存储介质 | |
CN110766052A (zh) | 图像展示方法、评估模型生成方法、装置及电子设备 | |
JP7355299B2 (ja) | 学習用データセット生成システム、学習サーバ、及び学習用データセット生成プログラム | |
CN115131783A (zh) | 基于机器视觉的用户饮食营养成分信息自主感知方法 | |
CN109145752A (zh) | 用于评估对象检测和跟踪算法的方法、装置、设备和介质 | |
CN117611549A (zh) | 一种芯片焊接质量实时监测方法、系统、设备及存储介质 | |
CN117078670B (zh) | 一种云相框的生产控制系统 | |
CN116740473B (zh) | 一种基于机器视觉的渔获物自动分拣方法及系统 | |
CN117234357A (zh) | 一种触摸屏多点触摸识别方法、装置及电子设备 | |
CN118135336A (zh) | 一种应用于安全监管的图像核查方法、装置及电子设备 | |
CN115937991A (zh) | 人体摔倒识别方法、装置、计算机设备及存储介质 | |
CN117011216A (zh) | 一种缺陷检测方法、装置、电子设备及存储介质 | |
CN115049882A (zh) | 模型的训练方法、图像多标签分类方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |