CN116977336A - 摄像头缺陷检测方法、装置、计算机设备及存储介质 - Google Patents

摄像头缺陷检测方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN116977336A
CN116977336A CN202311228949.2A CN202311228949A CN116977336A CN 116977336 A CN116977336 A CN 116977336A CN 202311228949 A CN202311228949 A CN 202311228949A CN 116977336 A CN116977336 A CN 116977336A
Authority
CN
China
Prior art keywords
camera
feature
scale
pixel point
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311228949.2A
Other languages
English (en)
Inventor
袁磊
王远
刘枢
吕江波
沈小勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Simou Intelligent Technology Co ltd
Shenzhen Smartmore Technology Co Ltd
Original Assignee
Suzhou Simou Intelligent Technology Co ltd
Shenzhen Smartmore Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Simou Intelligent Technology Co ltd, Shenzhen Smartmore Technology Co Ltd filed Critical Suzhou Simou Intelligent Technology Co ltd
Priority to CN202311228949.2A priority Critical patent/CN116977336A/zh
Publication of CN116977336A publication Critical patent/CN116977336A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20221Image fusion; Image merging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本申请涉及一种摄像头缺陷检测方法、装置、计算机设备、计算机可读存储介质及计算机程序产品。方法包括:通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;根据解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。采用本方法能够更准确地得到摄像头的缺陷检测结果,使得分割网络所划分的图像区域能够表征更为细小的缺陷。

Description

摄像头缺陷检测方法、装置、计算机设备及存储介质
技术领域
本申请涉及图像检测技术领域,特别是涉及一种摄像头缺陷检测方法、装置、计算机设备、计算机可读存储介质及计算机程序产品。
背景技术
在制造生产过程中由于设备以及生产环境等各种原因,工件难免会有缺陷,如压伤、划伤、异物等。这些缺陷严重阻碍了产品的正常使用。
但想要准确检出这些缺陷并不容易。尤其是对于像手机摄像头这样体积比较小的精密物料。手机摄像头的缺陷通常只有2-3mm,由于缺陷的面积非常小,检测变得很困难。如果直接放大图像,其放大后的图像信息缺失严重,缺陷检测的准确性低。
发明内容
基于此,有必要针对上述技术问题,提供一种摄像头缺陷检测方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,能够实现提高摄像头缺陷检测的准确性。
第一方面,本申请提供了一种摄像头缺陷检测方法,包括:
通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;
基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;
将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;
根据解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。
第二方面,本申请还提供了一种摄像头缺陷检测装置,包括:
编码模块,用于通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;
堆叠模块,用于基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;
解码模块,用于将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;
检测模块,用于根据解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。
第三方面,本申请还提供了一种计算机设备,计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述的摄像头缺陷检测方法中的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的摄像头缺陷检测方法中的步骤。
第五方面,本申请还提供了一种计算机程序产品,计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述的摄像头缺陷检测方法中的步骤。
上述摄像头缺陷检测方法、装置、计算机设备、计算机可读存储介质及计算机程序产品,通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;由于各个尺度的特征图提取的信息感受野,低层的局部信息更强、深层的语义信息更强,将各个尺度的特征图堆叠到一起,即融合了高尺度的全局信息与低尺度的局部信息;而将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;由于全连接层能够综合全部像素的上下文语义信息,以生成像素点信息,通过全连接层可将摄像头图像的全局信息准确地解码出来,且全连接层的各像素点信息,按照各自的权重进行解码,由此关注到了摄像头图像的局部信息,使得各像素点的解码后信息体现出更为细节的高频值,因而根据解码后像素点信息进行摄像头缺陷检测,可更准确地得到摄像头的缺陷检测结果,使得分割网络所划分的图像区域能够表征更为细小的缺陷。
附图说明
图1为本申请实施例提供的一种摄像头缺陷检测方法的应用环境图;
图2为本申请实施例提供的一种摄像头缺陷检测方法的流程示意图;
图3为本申请实施例提供的另一种摄像头缺陷检测方法的流程示意图;
图4为本申请实施例提供的一种摄像头缺陷检测装置的结构框图;
图5为本申请实施例提供的一种计算机设备的内部结构图;
图6为本申请实施例提供的一种计算机可读存储介质的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的摄像头缺陷检测方法,可以应用于如图1所示的应用环境中。其中,终端102通过通信网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备及便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一些实施例中,如图2所示,提供了一种摄像头缺陷检测方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤202,通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图。
分割网络是通过图像分割的方式检测摄像头缺陷的机器学习模型。可选地,分割网络是深度学习模型,以使得分割网络具有更高的通用性,且能够较为准确地解析出摄像头图像中的特征。分割网络包括用于特征提取与编码的主干网络(encoder),以及用于特征解码的解码器(decoder)。
主干网络(backbone)是用于对图像进行多尺度特征编码的分割网络结构。本实施例中的网络是从完整的神经网络模型中选取的主干网络,可针对不同编码需求而对主干网络进行适应性调整。摄像头图像是对摄像头拍摄所得的图像,用于进行缺陷检测。
多尺度特征编码是通过多个尺度,分别对摄像头图像进行信息编码的操作,以得到多个尺度的特征图,各个尺度下的特征图具有不同的像素数量。具体的,在多尺度特征编码的过程中,每个阶段提取的信息感受野不一样,在低尺度层次提取到的特征属于低层次卷积提取的特征,偏向于局部信息的提取,能够较为准确地检测出摄像头图像中的缺陷边缘;而在高尺度层次提取到的特征属于较深层次卷积提取的特征,偏向于全局信息的提取,其语义信息更强,能够准确地确定摄像头图像中的缺陷整体,以进行缺陷整体层次的判别。其中,低尺度层次和高尺度层次是基于神经网络模型的特征提取深浅定义的;与高尺度层次的尺度比较而言,在低尺度层次的尺度相对较大,其采样率相对较低,其保留的细节较多,因而偏向于提取出局部信息;相对应的,与低尺度层次比较而言,在高尺度层次的尺度相对较小,其采样率相对较高,其忽略的细节较多,因而偏向于提取出全局信息。
在一些实施例中,通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,包括:
通过分割网络中的主干网络,按照由大到小的尺度,对摄像头图像进行逐级编码。
由此,在编码过程中,能够将前一级的特征传递到下一级,使得网络提取到的特征能够准确地描述图像的局部信息与全局信息。
在一些实施例中,主干网络是高分辨率网络中的主干网络。高分辨率网络(high-resolution network,HRNet)是针对不同分辨率进行特征提取的网络。
高分辨率网络按照不同分辨率级别的不同分支提取不同尺度的特征,并将它们在网络中进行逐级融合,能够同时保留多个分辨率上的信息,并在不同分辨率间进行交互和融合。这种多级分辨率的设计使得HRNet在保留细节信息,分辨率级别实现了不同尺度的特征融合。通过高分辨率网络的主干网络进行特征提取的过程中,可使得每一尺度的特征图保持较高的分辨率,进而使得摄像头特征图更符合摄像头图像所表征的真实摄像头,以使得摄像头缺陷检测的准确性有所提升。
步骤204,基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图。
通道维度是表征特征图中的像素信息的维度。可选地,通道维度是在多个尺度上分别进行特征提取的结果,在一个尺度的特征图中,每个像素点对应于多个通道维度,通过多个通道维度的通道值,表征这个像素点在这一尺度下的信息。示例性地,未进行特征提取的摄像头图像中,其通道维度的通道值包括但不限于是红色通道值、绿色通道值和蓝色通道值,而在某一尺度下,基于卷积层对各像素的相邻像素进行通道维度值的增强处理,可得到像素点进行特征提取的方式,可得到像素点在这一尺度下的通道维度,而根据这一尺度下的通道维度进行通道值的特征提取,可得到下一尺度下的通道维度。
摄像头特征图是摄像头图像由主干网络编码所得的特征图。由于摄像头特征图是多个尺度的特征图进行通道堆叠所得,可不影响通道维度表征的局部信息和全局信息的表征,使得摄像头特征图将全局信息与局部信息能够准确地融合起来,以使得全连接层所得的解码后信息,能够更好地表征摄像头图像的全局信息与局部信息。以两个尺度的特征图为例,一个尺度的特征图为a个通道,另一个尺度的特征图为b个通道,对这两个尺度的特征图进行通道堆叠后,摄像头特征图为a+b个通道。
在一些实施例中,基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图,包括:
将多个尺度的特征图的特征放缩到统一尺寸,得到尺度对齐的各特征图;
对尺度对齐的各特征图进行通道维度堆叠,得到堆叠后的特征图;堆叠后的特征图为摄像头特征图。
由此,先对不同尺度的特征图进行尺度对齐,再进行特征堆叠,使得多个尺度的特征图聚合为一个尺度的摄像头特征图,使得各个尺度的特征图更好地保留自身的信息,且有助于全连接层在解码过程的参数设置,从而得到更准确地解码信息。
步骤206,将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息。
全连接层是基于摄像头特征图的全部像素点,对像素点信息进行解码的网络结构。当全连接层作为解码器进行像素点信息解码时,全连接层能够将摄像头特征图的每个像素保留下来,而不会对像素点的异常过滤,从而使得解码后像素点信息能够表征摄像头图像中的细节。由此,并没有使用传统的卷积层进行解码,不会因卷积层的共享权值而被过滤掉像素点信息的异常值,因而解码后像素点信息能够保留像素点信息的异常值和通用的特征。
像素点信息是各像素点的通道值。由于像素点信息属于摄像头特征图,且摄像头特征图的通道维度是堆叠后的通道维度,因而像素点信息能够由全连接层准确地解析出来,以得到解码后像素点信息。
解码后像素点信息是通过全连接层对像素点信息进行处理所得。解码后像素点信息用于表征摄像头图像在各区域的变化程度。可选地,解码后像素点信息是摄像头图像上的掩码区域,该掩码区域是由分割网络输出的结果。
具体的,解码器(Decoder)负责将骨干网络(backbone)提取到的特征解码,得到的掩码区域为缺陷区域(mask)。解码器的解码能力对缺陷分割的准确性影响重大。如何根据场景需求设计合适的解码器非常关键。如经典的deeplab,能够很好的综合上下文语义信息,但对局部信息的关注度有些不够,因此会导致一些细小缺陷的漏检。对于FCN,主要聚焦于局部信息,全局信息不够,导致容易出现噪点过检以及检测不全的问题,因而将全连接层作为解码器。
在一些实施例中,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息,包括:
对摄像头特征图中的各像素点进行信息提取,得到像素点信息;
按照全连接层中的各像素点权重,对像素点信息进行加权处理,得到解码后像素点信息。
各像素点权重是针对每个像素点设置的,可通过反向传播算法得到,用于使得每个像素点分别进行处理。
在一些实施例中,对摄像头特征图中的各像素点进行信息提取,得到像素点信息,包括:
针对摄像头特征图中的各像素点,获取各像素点的堆叠后通道值;
相对应的,按照全连接层中的各像素点权重,对像素点信息进行加权处理,得到解码后像素点信息,包括:
按照全连接层中的像素点权重矩阵,对各像素点的堆叠后通道值进行线性加权处理,得到各像素点解码后的堆叠后通道值。
由此,通过全连接层对像素点信息进行线性组合,使得解码后像素点信息能够表征更为细节的高频值。
当全连接层作为解码器进行像素点信息解码时,全连接层中的连接对于每个像素的权重都是独立的,可通过全连接层能够将摄像头特征图的每个像素的信息进行不同程度的特征强化,使得解码后像素点信息能够表征摄像头图像中的细节。
步骤208,根据解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。
在一些实施例中,缺陷检测结果是缺陷区域;根据解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果,包括:
根据解码后像素点信息,通过分割网络划分摄像头图像中的高频值区域;
将高频值区域所指示的区域确定为摄像头的缺陷区域。
由此,根据解码后像素点信息确定摄像头图像产生剧烈变化的高频值区域,准确地确定摄像头的缺陷区域。
在一些实施例中,根据解码后像素点信息,通过分割网络划分摄像头图像中的高频值区域,包括:
在摄像头图像中,通过分割网络对解码后像素点信息中的通道维度变化程度检测,得到满足边缘变化剧烈条件的高频信息;
将高频信息所指示的高频值区域,确定为高频值区域。
由此,根据与摄像头图像相同的通道维度,以使得分割网络从摄像头图像中,更准确地分割高频值区域。
示例性地,假设b批次的摄像头图像,长为h,宽为w,且一共有c个缺陷类别,则全连接层输出的解码后像素信息的通道维度为b*c*h*w。在c个类别的通道中,一个像素点在每个类别的通道值表征这个像素点属于这个缺陷类别的概率。
该方法还包括:
若根据摄像头的缺陷检测结果确定摄像头图像中的缺陷区域,则对缺陷区域的规格进行异常度检测;
若缺陷区域的规格满足废除条件,则对摄像头图像所属的摄像头进行报废处理;
其中,缺陷区域的规格用于表征缺陷区域的大小,规格可基于缺陷的面积、长度或宽度确定。
上述摄像头缺陷检测方法中,通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;由于各个尺度的特征图提取的信息感受野,低层的局部信息更强、深层的语义信息更强,将各个尺度的特征图堆叠到一起,即融合了高尺度的全局信息与低尺度的局部信息;而将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;由于全连接层能够综合全部像素的上下文语义信息,以生成像素点信息,通过全连接层可将摄像头图像的全局信息准确地解码出来,且全连接层的各像素点信息,按照各自的权重进行解码,由此关注到了摄像头图像的局部信息,使得各像素点的解码后信息体现出更为细节的高频值,因而根据解码后像素点信息进行摄像头缺陷检测,可更准确地得到摄像头的缺陷检测结果,使得分割网络所划分的图像区域能够表征更为细小的缺陷。此外,对于新缺陷进行检测时,只有新缺陷区域是需要标注的,并就新缺陷区域训练原有的分割网络即可,可扩展性高。而且,也不需要使用更大的图片而带来延时问题,对计算资源的要求较低。
在一些实施例中,基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图,包括:
基于多个尺度表征的特征图参数信息,从多个尺度的特征图中选取尺度处于预设尺度范围中的待堆叠特征图;
对待堆叠特征图进行通道维度堆叠,得到摄像头特征图。
特征图参数信息,能够从尺度角度反映不同尺度的特征图处理所需计算量、高频响应区间等信息。具体的,当特征图的尺度过大时,一方面,其所需计算量越大,会影响模型推理速度,使得摄像头特征图在全连接层解码时的速度过低,另一方面,越容易因摄像头图像上的污渍影响缺陷检测的鲁棒性,而且,越容易出现边缘等高频响应过于强,导致高频区域涵盖部分正常区域的情况,该情况可能会导致准确性下降。基于此,需要选择尺度处于预设尺度范围的特征图。
尺度处于预设尺度范围的特征图,是通过尺度筛选出的特征图,这些尺度的特征图的计算量适度,且在相应尺度下的特征已能够忽略摄像头图像上的污渍,因而能够使得缺陷检测的鲁棒性较高,边缘等高频响应适度,保障准确性增加。
通过对待堆叠特征图进行通道堆叠,把控摄像头特征图所需计算量,提高推理速度,且可把控数据质量,从而提高全连接层解码时的鲁棒性,且降低小噪声响应频率。
在一些实施例中,对待堆叠特征图进行通道维度堆叠,得到摄像头特征图,包括:
按照像素点在各待堆叠特征图间的位置对应关系,对各待堆叠特征图中的通道维度进行堆叠处理,得到摄像头特征图;
其中,位置对应关系是各待堆叠特征图中,在相同位置的像素。
基于多个尺度表征的特征图参数信息,表征计算量与噪声均适度等待均衡信息,针对尺度处于预设尺度范围的特征图进行堆叠,可把控摄像头特征图所需计算量,提高推理速度,且可把控数据质量,从而提高全连接层解码时的鲁棒性、降低小噪声响应频率。
在一些实施例中,多个尺度的特征图是按照尺度顺序,逐级对摄像头图像进行特征编码所得。尺度顺序表征多个尺度在摄像头图像进行特征编码过程中的顺序。例如:尺度顺序是按照尺度由大到小的规格顺序进行编码的。
相对应的,基于多个尺度表征的特征图参数信息,从多个尺度的特征图中选取尺度处于预设尺度范围中的待堆叠特征图,包括:
确定多个尺度的特征图在尺度顺序中的编码位置;
按照小尺度区间内的编码位置所表征尺度的特征图,从多个尺度的特征图中选取待堆叠特征图。
编码位置,用于表征各个尺度的特征图依次编码过程中的位置。小尺度区间用于表征多个尺度中,处于小尺度范围内连续尺度下的特征图。可选地,小尺度区间是多个预设的尺度个数,用于确定连续的小尺度特征图。
在一些实施例中,确定多个尺度的特征图在尺度顺序中的编码位置,包括:
对主干网络逐级输出的特征图进行统计;
根据主干网络逐级输出的特征图数量,确定多个尺度的特征图在尺度顺序中的编码位置。
由此,基于使得预先设定的尺度顺序与主干网络逐级输出的特征图对齐,以准确地确定出多个尺度的特征图在尺度顺序中的编码位置。
在尺度顺序是确定的情况下,逐级对摄像头图像进行多尺度特征编码,在编码过程中,能够将前一级的特征传递到下一级,以将尺度处于预设尺度范围的特征图汇聚到小尺度区间内,快捷地选取尺度处于预设尺度范围的特征图,从而使得网络提取到的特征能够较好的描述图像的局部信息以及全局信息。
示例性地,对主干网络输出的最后三个尺度的特征图进行通道堆叠,得到摄像头特征图,以通过全连接层对摄像头特征图的像素点信息进行解码,从而提高模型的鲁棒性,降低模型对过小噪点响应的情况,且提高模型的推理速度。
在一些实施例中,基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图之前,该方法还包括:
通过分割网络分析缺陷检测的打光方式;
按照打光方式,对多个尺度的特征图进行通道维度的打光,得到打光后的多个尺度的特征图;
相对应的,基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图,包括:
对打光后的多个尺度的特征图进行通道维度堆叠,得到摄像头特征图。
打光方式是针对摄像头图像的候选缺陷区域设置光源的方式,针对不同缺陷类型,需要采用合适的光源才能检测出来。可选地,打光方式包括单光源或者多光源的打光方式,且打光方式还可以涉及打光的角度与光源的位置等信息。打光后的多个尺度的特征图,是将要进行通道维度堆叠的特征图。
在一些实施例中,按照打光方式,对多个尺度的特征图进行通道维度的打光,得到打光后的多个尺度的特征图,包括:
在确定待堆叠特征图后,按照打光方式,对待堆叠特征图可进行处理的通道维度进行打光处理,得到打光后的待堆叠特征图。
由此,需要进行打光处理的特征图相对较少,处理效率相对较高。
通过分割网络分析候选缺陷区域的打光方式,能够针对各种类型的候选缺陷区域选择合适的打光方式进行打光,使得基于打光后候选缺陷区域而得到的缺陷检测结果更为准确。而且,避免的挑选打光以及检测结果融合的困难,且能够根据不同缺陷类型选择打光方式,若是针对新类型的缺陷进行检测,只需要进行标注与训练即可,无需更改神经网络的结果,易于扩展。
在一些实施例中,通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图之前,该方法还包括:
获取初始摄像头图像的通道特征;
将初始摄像头图像的通道特征输入注意力机制网络结构进行处理,输出初始摄像头图像的通道权重;
根据初始摄像头图像的通道权重,对初始摄像头图像的通道特征进行增强处理,得到摄像头图像。
初始摄像头图像是直接获取到的图像,初始摄像头图像的通道特征是初始摄像头图像的通道维度值或通道维度值组合。注意力机制网络结构用于增强初始摄像头图像的通道特征,使得原有的特征进一步增强,以便于能够更准确地确定出合适的打光方式。本实施例中,摄像头图像是初始摄像头图像进行通道维度增强所得。
在一些实施例中,将初始摄像头图像的通道特征输入注意力机制网络结构进行处理,输出初始摄像头图像的通道权重,包括:
针对初始摄像头图像的各像素点,对各像素点分别对应的多个通道维度值进行均值化处理,得到各像素点的通道均值;
通过注意力机制网络结构的两个全连接层,对该各像素点的通道均值进行全连接处理,得到初始摄像头图像的通道权重。
可选地,根据初始摄像头图像的通道权重,对初始摄像头图像的通道特征进行增强处理,包括:
将初始摄像头图像的通道权重与初始摄像头图像的通道值,进行矩阵乘法。
可选地,在主干网络逐级提取多个尺度的特征时,对于输入的第一层,增加通道注意力机制。
通过增加通道注意力机制网络结构,使得对于每种打光的图片的权重是不一样的,模型自己学习权重,从而针对各个缺陷能够更多的使用对应的光源,从而通过更多种类的打光方式,对不同缺陷区域进行打光处理,使得缺陷检测的准确性有所提升。
在一个示例性地实施例中,如图3所示,初始摄像头图像输入到分割网络后,通过通道注意力机制网络结构对原始图像的维度特征进行线性相加或其他加权处理,实现了初始摄像头图像的通道维度特征增强,得到了摄像头图像;接着,对摄像头图像进行多个尺度编码,并对主干网络输出的最后三个尺度的特征图进行尺度对齐与通道堆叠,得到摄像头特征图;接着,通过全连接层对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;根据解码后像素点信息进行摄像头缺陷检测,得到摄像头图像上的缺陷区域。
在一些实施例中,方法还包括:
在基于摄像头样本图像训练分割网络的过程中,按照交叉熵损失函数确定摄像头样本图像中的各像素点损失值;
通过比对各像素点损失值,筛选出满足大损失值条件的梯度反传像素点;
通过梯度反传像素点优化初始分割网络,直至初始分割网络收敛时,得到分割网络。
大损失值条件是一个区间值,其是基于各像素点损失值的比对结果设定的排名条件。可选地,当某像素点的像素点损失值排名,超过各像素点损失值的某指标时,可确定该像素点为满足大损失值条件的梯度反传像素点。梯度反传像素点是用于表征缺陷的像素点。
在一些实施例中,通过比对各像素点损失值,筛选出满足大损失值条件的梯度反传像素点,包括:
比对各像素点损失值,以使得对各像素点损失值从大到小进行排序,得到损失值序列;
按照从前往后从损失值序列中筛选出百分之五的像素点;
将这百分之五的像素点作为梯度反传像素点。
在一些实施例中,通过梯度反传像素点优化初始分割网络,包括:
基于梯度反传像素点进行反向传播;
根据反向传播的结果调整初始分割网络的网络参数。
由此,考虑到摄像头上的缺陷非常细小,图片上绝大部分像素都是背景,因而相比一般的分割问题,正负样本不均衡。因而在基于摄像头样本图像训练分割网络的过程中,选择损失值较大的像素点作为梯度反传像素点,通过梯度反传像素点进行优化,使得平衡正负像素点,使分割模型能够更准确地识别出缺陷区域。
可选地,基于摄像头样本图像训练分割网络的过程,是用骰子损失函数(diceloss function,Dice Loss)等用于图像分割任务训练的损失函数进行训练的过程;该过程配合上述实施例的交叉熵损失函数训练模型,即骰子损失函数的权重大于上述实施例的交叉熵损失函数,以使得分割效果更优。
由此,使用合适的网络并进行优化,提高小缺陷的检出能力。且使用AI融合多光源进行检测,避免了单光源的选择困难以及各个光源融合的难题,且易于拓展。
具体的,针对细小缺陷对分割网络从在主干网络设置注意力机制网络结构,使得打光方式能够更准确地适应性调整,从而提高缺陷检测的准确性,而将全连接层作为解码器进行解码,对各像素点分别进行检测;并设定梯度反传像素点,提高网络的检出能力。对于多打光图片,通过分割网络选择合适的图片进行检测避免打光方式的挑选与检测结果融合困难的问题。而且,非常容易拓展,对于新缺陷,几乎不需要开发,只需要标注、训练即可。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种摄像头缺陷检测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个摄像头缺陷检测装置实施例中的具体限定可以参见上文中对于摄像头缺陷检测方法的限定,在此不再赘述。
在一些实施例中,如图4所示,提供了一种摄像头缺陷检测装置,包括:
编码模块402,用于通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;
堆叠模块404,用于基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;
解码模块406,用于将分割网络中的全连接层作为解码器,对摄像头特征图的像素点信息进行解码,得到解码后像素点信息;
检测模块408,用于根据解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。
在一些实施例中,在对摄像头特征图的像素点信息进行解码,得到解码后像素点信息方面,解码模块406具体用于:
对摄像头特征图中的各像素点进行信息提取,得到像素点信息;
按照全连接层中的各像素点权重,对像素点信息进行加权处理,得到解码后像素点信息。
在一些实施例中,在基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图方面,堆叠模块404具体用于:
基于多个尺度表征的特征图参数信息,从多个尺度的特征图中选取尺度处于预设尺度范围中的待堆叠特征图;
对待堆叠特征图进行通道维度堆叠,得到摄像头特征图。
在一些实施例中,多个尺度的特征图是按照尺度顺序,逐级对摄像头图像进行特征编码所得;在基于多个尺度表征的特征图参数信息,从多个尺度的特征图中选取尺度处于预设尺度范围中的待堆叠特征图方面,堆叠模块404具体用于:
确定多个尺度的特征图在尺度顺序中的编码位置;
按照小尺度区间内的编码位置所表征尺度的特征图,从多个尺度的特征图中选取待堆叠特征图。
在一些实施例中,上述装置还包括打光模块,打光模块用于:
通过分割网络分析缺陷检测的打光方式;
按照打光方式,对多个尺度的特征图进行通道维度的打光,得到打光后的多个尺度的特征图;
相对应的,在基于多个尺度的特征图进行通道维度堆叠,得到摄像头特征图方面,堆叠模块404具体用于:
对打光后的多个尺度的特征图进行通道维度堆叠,得到摄像头特征图。
在一些实施例中,打光模块还用于:
获取初始摄像头图像的通道特征;
将初始摄像头图像的通道特征输入注意力机制网络结构进行处理,输出初始摄像头图像的通道权重;
根据初始摄像头图像的通道权重,对初始摄像头图像的通道特征进行增强处理,得到摄像头图像。
在一些实施例中,该装置对应的训练模块,用于:
在基于摄像头样本图像训练分割网络的过程中,按照交叉熵损失函数确定摄像头样本图像中的各像素点损失值;
通过比对各像素点损失值,筛选出满足大损失值条件的梯度反传像素点;
通过梯度反传像素点优化初始分割网络,直至初始分割网络收敛时,得到分割网络。
在一些实施例中,主干网络是高分辨率网络中的主干网络。
上述摄像头缺陷检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器,也可以以软件形式存储于计算机设备中的存储器,以便于处理器调用执行以上各个模块对应的操作。
在一些实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元及输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现上述的摄像头缺陷检测方法中的步骤。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏;该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一些实施例中,还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一些实施例中,如图5所示提供了一种计算机可读存储介质的内部结构图,计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一些实施例中,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(FerroelectricRandomAccess Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static RandomAccess Memory,SRAM)或动态随机存取存储器(Dynamic Random AccessMemory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施例,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (11)

1.一种摄像头缺陷检测方法,其特征在于,包括:
通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;
基于所述多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;
将所述分割网络中的全连接层作为解码器,对所述摄像头特征图的像素点信息进行解码,得到解码后像素点信息;
根据所述解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述摄像头特征图的像素点信息进行解码,得到解码后像素点信息,包括:
对所述摄像头特征图中的各像素点进行信息提取,得到像素点信息;
按照所述全连接层中的各像素点权重,对所述像素点信息进行加权处理,得到解码后像素点信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述多个尺度的特征图进行通道维度堆叠,得到摄像头特征图,包括:
基于所述多个尺度表征的特征图参数信息,从所述多个尺度的特征图中选取尺度处于预设尺度范围中的待堆叠特征图;
对所述待堆叠特征图进行通道维度堆叠,得到摄像头特征图。
4.根据权利要求3所述的方法,其特征在于,所述多个尺度的特征图是按照尺度顺序,逐级对所述摄像头图像进行特征编码所得;
所述基于所述多个尺度表征的特征图参数信息,从所述多个尺度的特征图中选取尺度处于预设尺度范围中的待堆叠特征图,包括:
确定所述多个尺度的特征图在所述尺度顺序中的编码位置;
按照小尺度区间内的所述编码位置所表征尺度的特征图,从所述多个尺度的特征图中选取待堆叠特征图。
5.根据权利要求1所述的方法,其特征在于,所述基于所述多个尺度的特征图进行通道维度堆叠,得到摄像头特征图之前,所述方法还包括:
通过所述分割网络分析缺陷检测的打光方式;
按照所述打光方式,对所述多个尺度的特征图进行通道维度的打光,得到打光后的所述多个尺度的特征图;
所述基于所述多个尺度的特征图进行通道维度堆叠,得到摄像头特征图,包括:
对所述打光后的所述多个尺度的特征图进行通道维度堆叠,得到摄像头特征图。
6.根据权利要求5所述的方法,其特征在于,所述通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图之前,所述方法还包括:
获取初始摄像头图像的通道特征;
将所述初始摄像头图像的通道特征输入注意力机制网络结构进行处理,输出所述初始摄像头图像的通道权重;
根据所述初始摄像头图像的通道权重,对所述初始摄像头图像的通道特征进行增强处理,得到所述摄像头图像。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在基于摄像头样本图像训练所述分割网络的过程中,按照交叉熵损失函数确定所述摄像头样本图像中的各像素点损失值;
通过比对所述各像素点损失值,筛选出满足大损失值条件的梯度反传像素点;
通过所述梯度反传像素点优化初始分割网络,直至所述初始分割网络收敛时,得到所述分割网络。
8.根据权利要求1所述的方法,其特征在于,所述主干网络是高分辨率网络中的主干网络。
9.一种摄像头缺陷检测装置,其特征在于,包括:
编码模块,用于通过分割网络中的主干网络对摄像头图像进行多尺度特征编码,得到多个尺度的特征图;
堆叠模块,用于基于所述多个尺度的特征图进行通道维度堆叠,得到摄像头特征图;
解码模块,用于将所述分割网络中的全连接层作为解码器,对所述摄像头特征图的像素点信息进行解码,得到解码后像素点信息;
检测模块,用于根据所述解码后像素点信息进行摄像头缺陷检测,得到缺陷检测结果。
10.一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202311228949.2A 2023-09-22 2023-09-22 摄像头缺陷检测方法、装置、计算机设备及存储介质 Pending CN116977336A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311228949.2A CN116977336A (zh) 2023-09-22 2023-09-22 摄像头缺陷检测方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311228949.2A CN116977336A (zh) 2023-09-22 2023-09-22 摄像头缺陷检测方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN116977336A true CN116977336A (zh) 2023-10-31

Family

ID=88477077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311228949.2A Pending CN116977336A (zh) 2023-09-22 2023-09-22 摄像头缺陷检测方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN116977336A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117495884A (zh) * 2024-01-02 2024-02-02 湖北工业大学 一种钢铁表面缺陷分割方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140073887A (ko) * 2012-12-07 2014-06-17 김규석 감시카메라용 정션박스
CN110689021A (zh) * 2019-10-17 2020-01-14 哈尔滨理工大学 一种基于深度学习的低可见度环境下实时目标检测方法
CN114463341A (zh) * 2022-01-11 2022-05-10 武汉大学 一种基于长短距离特征的医学图像分割方法
CN115601326A (zh) * 2022-10-17 2023-01-13 盐城工学院(Cn) 一种基于双边特征融合网络的手机摄像头缺陷检测方法
CN116091762A (zh) * 2023-03-06 2023-05-09 大连交通大学 一种基于rgbd数据和视锥体的三维目标检测方法
CN116246110A (zh) * 2023-02-22 2023-06-09 重庆邮电大学 基于改进胶囊网络的图像分类方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140073887A (ko) * 2012-12-07 2014-06-17 김규석 감시카메라용 정션박스
CN110689021A (zh) * 2019-10-17 2020-01-14 哈尔滨理工大学 一种基于深度学习的低可见度环境下实时目标检测方法
CN114463341A (zh) * 2022-01-11 2022-05-10 武汉大学 一种基于长短距离特征的医学图像分割方法
CN115601326A (zh) * 2022-10-17 2023-01-13 盐城工学院(Cn) 一种基于双边特征融合网络的手机摄像头缺陷检测方法
CN116246110A (zh) * 2023-02-22 2023-06-09 重庆邮电大学 基于改进胶囊网络的图像分类方法
CN116091762A (zh) * 2023-03-06 2023-05-09 大连交通大学 一种基于rgbd数据和视锥体的三维目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
丛爽: "《智能控制系统及其应用第2版》", 中国科学技术大学出版社, pages: 285 - 286 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117495884A (zh) * 2024-01-02 2024-02-02 湖北工业大学 一种钢铁表面缺陷分割方法、装置、电子设备及存储介质
CN117495884B (zh) * 2024-01-02 2024-03-22 湖北工业大学 一种钢铁表面缺陷分割方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN110111334B (zh) 一种裂缝分割方法、装置、电子设备及存储介质
WO2021164534A1 (zh) 图像处理方法、装置、设备及存储介质
CN111368636B (zh) 目标分类方法、装置、计算机设备和存储介质
CN105453132B (zh) 实施图像处理的信息处理设备和图像处理方法
CN114549913B (zh) 一种语义分割方法、装置、计算机设备和存储介质
CN111723798A (zh) 一种基于关联性层级残差的多实例自然场景文本检测方法
CN116977336A (zh) 摄像头缺陷检测方法、装置、计算机设备及存储介质
CN110163095B (zh) 回环检测方法、回环检测装置及终端设备
CN111242176A (zh) 计算机视觉任务的处理方法、装置及电子系统
CN114998756A (zh) 一种基于yolov5的遥感图像检测方法、装置及存储介质
US20220301106A1 (en) Training method and apparatus for image processing model, and image processing method and apparatus
CN116630630B (zh) 语义分割方法、装置、计算机设备及计算机可读存储介质
CN113971732A (zh) 小目标检测方法、装置、可读存储介质及电子设备
CN111753729B (zh) 一种假脸检测方法、装置、电子设备及存储介质
TWI803243B (zh) 圖像擴增方法、電腦設備及儲存介質
CN111369489A (zh) 一种图像识别方法、装置及终端设备
CN113706636A (zh) 一种用于篡改图像识别的方法与装置
Jia et al. Learning Rich Information for Quad Bayer Remosaicing and Denoising
CN116612474B (zh) 对象检测方法、装置、计算机设备及计算机可读存储介质
CN116630629B (zh) 基于域适应的语义分割方法、装置、设备及存储介质
CN114463187B (zh) 基于聚合边缘特征的图像语义分割方法及系统
CN117975473A (zh) 票据文本检测模型训练及检测方法、装置、设备和介质
CN112329925B (zh) 模型生成方法、特征提取方法、装置及电子设备
CN117953321A (zh) 缺陷图像生成方法、装置、计算机设备及存储介质
CN113888522A (zh) 基于数字图像的目标检测方法、系统及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination