CN118036669A - 一种稀疏自编码模型的训练方法、装置、设备和介质 - Google Patents
一种稀疏自编码模型的训练方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN118036669A CN118036669A CN202410445122.5A CN202410445122A CN118036669A CN 118036669 A CN118036669 A CN 118036669A CN 202410445122 A CN202410445122 A CN 202410445122A CN 118036669 A CN118036669 A CN 118036669A
- Authority
- CN
- China
- Prior art keywords
- coding model
- sparse self
- error
- decoder
- weight parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 119
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000007547 defect Effects 0.000 claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 31
- 238000011176 pooling Methods 0.000 claims abstract description 28
- 238000001514 detection method Methods 0.000 claims description 79
- 239000011324 bead Substances 0.000 claims description 49
- 230000004913 activation Effects 0.000 claims description 41
- 230000006870 function Effects 0.000 claims description 38
- 210000002569 neuron Anatomy 0.000 claims description 27
- 230000000694 effects Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 4
- 238000012546 transfer Methods 0.000 claims description 4
- 238000001994 activation Methods 0.000 description 33
- 238000004519 manufacturing process Methods 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 9
- 238000013135 deep learning Methods 0.000 description 8
- 238000010801 machine learning Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 5
- 239000013078 crystal Substances 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000002950 deficient Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003190 augmentative effect Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Landscapes
- Image Analysis (AREA)
Abstract
本申请公开了一种稀疏自编码模型的训练方法、装置、设备和介质,用于提高显示器像素点外观缺陷检测精确度和速度。本申请训练方法包括:获取训练样本集合;构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合;根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数;更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
Description
技术领域
本申请实施例涉及深度神经网络模型训练与优化及显示器像素点外观缺陷检测领域,尤其涉及一种稀疏自编码模型的训练方法、装置、设备和介质。
背景技术
Micro-LED是LED技术的一种变种,它使用微小尺寸的LED芯片作为像素。每个Micro-LED芯片可以独立控制,因此可以实现高分辨率的显示。这些微小的LED芯片可以发光,从而形成图像。与传统的液晶显示屏(LCD)和有机发光二极管(OLED)相比,Micro-LED具有高亮度、高分辨率、高对比度、高节能及更长的寿命等优点。Micro-LED技术在各种应用领域中都具有巨大潜力,包括电视、显示屏、虚拟现实(VR)和增强现实(AR)头戴设备、智能手表、汽车显示和广告牌等。与此同时,Micro-LED技术也面临着一些挑战,其中Micro-LED由于生产制作工艺环节产生的外观缺陷检测仍然是一个复杂的问题。
Micro-LED外观缺陷是指在Micro-LED显示屏制造过程中可能出现的一些不良外观特征或缺陷,如灯珠缺失、偏移、角度旋转、断晶、立晶、划痕、损伤及脏污等,这些缺陷可能会严重影响显示质量。现有技术中,为了检测和纠正这些外观缺陷,通常使用自动化检测系统结合机器视觉、深度学习和其他技术,以在生产过程中及时检测缺陷并将不良产品剔除。
目前,大部分Micro-LED外观缺陷都是利用机器学习和有监督深度学习方法进行检测,大概流程为:
首先,在制备好Micro-LED芯片后,需要设置光学检测系统。这包括选择适当的光源和相机,确保光源的均匀照射,并设置相机参数以捕捉高分辨率的图像。接下来,光学系统开始采集Micro-LED芯片的图像。通常,光学系统会以不同的光照条件、不同的角度和不同的颜色设置采集图像,以确保全面的检测。对采集到的图像需要进行预处理,以去除噪音、调整亮度和对比度,并进行其他图像增强操作,以便更好地识别缺陷。接下来即可应用机器学习、深度学习来检测缺陷。得到检测结果之后,检测系统会对检测到的缺陷进行分类和分级。通常,不同的缺陷会被分为严重和轻微,以确定是否需要剔除产品。在实时生产线上,如果检测到有缺陷的Micro-LED芯片,它们会被自动剔除或标记以后续处理。这确保了生产线的持续运作。
这类方法有着诸多缺陷,这类有监督的机器学习和深度学习算法虽然能简化整体算法流程,不依赖人为制定的特征,但是依赖大量的标注数据。而标记数据样本需要一定的经验知识,且容易引入噪声标签,影响最终检测结果,降低显示器像素点外观缺陷检测精确度和速度。
发明内容
本申请公开了一种稀疏自编码模型的训练方法、装置、设备和介质,用于提高显示器像素点外观缺陷检测精确度和速度。
本申请第一方面提供了一种稀疏自编码模型的训练方法,包括:
获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像;
构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;
将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;
根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合;
根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数;
更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
可选的,误差集合包括第一误差和KL散度误差;
根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合,包括:
根据输入数据和解码器重构数据结合样本数量信息进行差异的计算,生成第一误差;
根据输入数据和初始权重参数生成稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度;
根据平均激活度和稀疏性参数生成KL散度误差。
可选的,根据输入数据和初始权重参数生成稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度,包括:
根据训练样本集合和初始权重参数生成自编码网络隐层神经元的激活度集合;
根据激活度集合和样本数量计算神经元在所有训练样本上的平均激活度。
可选的,第一误差为均方误差;
根据输入数据和解码器重构数据结合样本数量信息进行差异的计算,生成第一误差,包括
根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差。
可选的,根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数,包括:
计算损失函数关于解码器重构数据的第一梯度;
根据第一梯度和预设学习率并结合随机梯度下降算法更新解码器的初始权重参数;
计算损失函数关于第二输出数据的第二梯度,第二输出数据为编码器的输出数据;
根据第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数。
可选的,在更新完成后重复迭代的环节,直到稀疏自编码模型达到预设条件之后,训练方法还包括:
获取Micro-LED外观图像;
对Micro-LED外观图像采用传统AOI算法进行灯珠初筛,生成AOI检测结果,同时获取灯珠截图;
将的灯珠截图输入稀疏自编码模型进行缺陷检测,获取AI检测结果;
将AOI检测结果与AI检测结果进行整合,并反算到Micro-LED外观图像上,得到目标检测结果。
本申请第二方面提供了一种稀疏自编码模型的训练装置,包括:
第一获取单元,用于获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像;
构建单元,用于构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;
输入单元,用于将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;
第一生成单元,用于根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合;
第二生成单元,用于根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数;
迭代单元,用于更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
可选的,误差集合包括第一误差和KL散度误差;
第一生成单元,包括:
第一生成模块,用于根据输入数据和解码器重构数据结合样本数量信息进行差异的计算,生成第一误差;
第二生成模块,用于根据输入数据和初始权重参数生成稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度;
第三生成模块,用于根据平均激活度和稀疏性参数生成KL散度误差。
可选的,第二生成模块,包括:
根据训练样本集合和初始权重参数生成自编码网络隐层神经元的激活度集合;
根据激活度集合和样本数量计算神经元在所有训练样本上的平均激活度。
可选的,第一误差为均方误差;
第一生成模块,包括:
根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差。
可选的,第二生成单元,包括:
计算损失函数关于解码器重构数据的第一梯度;
根据第一梯度和预设学习率并结合随机梯度下降算法更新解码器的初始权重参数;
计算损失函数关于第二输出数据的第二梯度,第二输出数据为编码器的输出数据;
根据第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数。
可选的,在迭代单元之后,训练装置还包括:
第二获取单元,用于获取Micro-LED外观图像;
第三生成单元,用于对Micro-LED外观图像采用传统AOI算法进行灯珠初筛,生成AOI检测结果,同时获取灯珠截图;
第三获取单元,用于将的灯珠截图输入稀疏自编码模型进行缺陷检测,获取AI检测结果;
整合单元,用于将AOI检测结果与AI检测结果进行整合,并反算到Micro-LED外观图像上,得到目标检测结果。
本申请第三方面提供了一种电子设备,包括:
处理器、存储器、输入输出单元以及总线;
处理器与存储器、输入输出单元以及总线相连;
存储器保存有程序,处理器调用程序以执行如第一方面以及第一方面的任意可选的训练方法。
本申请第四方面提供了一种计算机可读存储介质,计算机可读存储介质上保存有程序,程序在计算机上执行时执行如第一方面以及第一方面的任意可选的训练方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,首先获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像,只需要获取到正常灯珠的图像即可。接下来,构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层。然后将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据。根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合。根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数。更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
通过在编码器中构建卷积层和稀疏限制组,构建了一个无监督神经网络模型,通过一个深度神经网络(带稀疏限制组的编码器)来学习数据的低维表示,并使用另一个神经网络(解码器)来将这个低维表示转换回原始数据。通过最小化重构数据与原始数据之间的误差来还原输入数据,从而对输入数据进行分析判断。无需大规模地对训练样本进行严格的标记数据,同时避免了引入噪声标签,只需要少量的正常产品的图像数据进行训练,即可得到很好的检测效果,提高了训练过程速度和精准度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请稀疏自编码模型的训练方法的一个实施例流程图;
图2为本申请稀疏自编码模型的训练方法的另一个实施例第一阶段流程图;
图3为本申请稀疏自编码模型的训练方法的另一个实施例第二阶段流程图;
图4为本申请稀疏自编码模型的训练装置的一个实施例示意图;
图5为本申请稀疏自编码模型的训练装置的另一个实施例示意图;
图6为本申请设备的一个实施例示意图;
图7为本申请稀疏自编码模型的一个实施例示意图;
图8为本申请权值更新的一个示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
在现有技术中,Micro-LED外观缺陷是指在Micro-LED显示屏制造过程中可能出现的一些不良外观特征或缺陷,如灯珠缺失、偏移、角度旋转、断晶、立晶、划痕、损伤及脏污等,这些缺陷可能会严重影响显示质量。现有技术中,为了检测和纠正这些外观缺陷,通常使用自动化检测系统结合机器视觉、深度学习和其他技术,以在生产过程中及时检测缺陷并将不良产品剔除。
目前,大部分Micro-LED外观缺陷都是利用机器学习和有监督深度学习方法进行检测,大概流程为:
首先,在制备好Micro-LED芯片后,需要设置光学检测系统。这包括选择适当的光源和相机,确保光源的均匀照射,并设置相机参数以捕捉高分辨率的图像。接下来,光学系统开始采集Micro-LED芯片的图像。通常,光学系统会以不同的光照条件、不同的角度和不同的颜色设置采集图像,以确保全面的检测。对采集到的图像需要进行预处理,以去除噪音、调整亮度和对比度,并进行其他图像增强操作,以便更好地识别缺陷。接下来即可应用机器学习、深度学习来检测缺陷。得到检测结果之后,检测系统会对检测到的缺陷进行分类和分级。通常,不同的缺陷会被分为严重和轻微,以确定是否需要剔除产品。在实时生产线上,如果检测到有缺陷的Micro-LED芯片,它们会被自动剔除或标记以后续处理。这确保了生产线的持续运作。
这类方法有着诸多缺陷,这类有监督的机器学习和深度学习算法虽然能简化整体算法流程,不依赖人为制定的特征,但是依赖大量的标注数据。而标记数据样本需要一定的经验知识,且容易引入噪声标签,影响最终检测结果,降低训练过程速度和精准度。
基于此,本申请公开了一种稀疏自编码模型的训练方法、装置、设备和介质,用于提高模型的训练速度和精准度。
下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的方法可以应用于服务器、设备、终端或者其它具备逻辑处理能力的设备,对此,本申请不作限定。为方便描述,下面以执行主体为终端为例进行描述。
请参阅图1,本申请提供了一种稀疏自编码模型的训练方法的一个实施例,包括:
101、获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像;
本实施例中,终端首先获取训练样本集合,训练样本集合包括若干张正常正常状态下的灯珠样本图像。本实施例中,训练时无需存在缺陷的训练样本数据,只需要提供少量正常的灯珠图片即可。
102、构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;
自编码器是一种比较特殊的无监督神经网络模型,通过一个深度神经网络(编码器)来学习数据的低维表示,并使用另一个神经网络(解码器)来将这个低维表示转换回原始数据。通过最小化重构数据与原始数据之间的误差来还原输入数据,从而对输入数据进行分析判断。
终端构建稀疏自编码模型,具体是基于自编码器来进行构建。
在神经网络中,使得部分神经元抑制的限制叫做稀疏性限制。本实施例提出以深度卷积神经网络(DCNN)作为编码器和解码器,并在模型中设计稀疏性限制,增加网络的拟合能力,充分发挥DCNN提取图像特征的优势,可以有更效地发现数据中的结构和规律,并且具有良好的生成能力。本实施例中,稀疏自编码器网络模型结构如图2所示:
稀疏自编码模型分为编码器(Encoder)和解码器(Deconder)两个部分,其中Encoder包括三个卷积+稀疏限制组,加上三个池化层。卷积层的作用是提取图像特征,生成特征的低维映射。稀疏限制组采用KL散度等方式,降低网络过拟合,增加模型复杂度和泛化能力。池化层作用是对输入图像下采样。Deconder包括四个反卷积层和三个反池化层,反卷积即转置卷积,是卷积操作的逆过程,作用是将低维数据映射回高维空间,生成重构数据。反池化即池化的逆操作,作用是上采样。
需要说明的是,上述编码器(Encoder)和解码器(Deconder)两个部分的各个层的数量需要根据训练样本的种类和分析类型相关,并不是唯一的,当训练样本的种类多于预设数量,或者需要分析的类型超过预设数量时,需要增设卷积+稀疏限制组,反之可以减少卷积+稀疏限制组,以此降低计算量。
103、将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;
终端针对训练样本集合进行稀疏自编码模型的构建之后,即可将训练样本集合中的训练样本作为输入数据输入稀疏自编码模型中,当训练样本经过编码器输出后,当即进入解码器中进行重构,最终生成解码器重构数据。
104、根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合;
105、根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数;
终端根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合,即根据输入的训练样本和重构的数据进行差异化对比,生成差异误差。
然后根据该误差构建对应的损失函数,通过反向传播的方式进行编码器和解码器的权重参数的迭代更新。
106、更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
当每一次编码器和解码器的权重参数完成迭代更新之后,重新输入训练样本,直到训练样本的训练次数到达预设值,或者是误差集合显示训练样本与重构数据的差异已经达到预设范围内。
本实施例中,首先获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像,只需要获取到正常灯珠的图像即可。接下来,构建稀疏自编码模型并设置稀疏性参数和初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层。然后将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据。根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合。根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数。更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
通过在编码器中构建卷积层和稀疏限制组,构建了一个无监督神经网络模型,通过一个深度神经网络(带稀疏限制组的编码器)来学习数据的低维表示,并使用另一个神经网络(解码器)来将这个低维表示转换回原始数据。通过最小化重构数据与原始数据之间的误差来还原输入数据,从而对输入数据进行分析判断。无需大规模地对训练样本进行严格的标记数据,同时避免了引入噪声标签,只需要少量的正常产品的图像数据进行训练,即可得到很好的检测效果,提高了训练过程速度和精准度。
请参阅图2,本申请提供了一种稀疏自编码模型的训练方法的一个实施例,包括:
201、获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像;
202、构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;
203、将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;
本实施例中的步骤201至步骤202与前述实施例中步骤101至102类似,此处不再赘述。
204、根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差;
本实施例中,终端根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差,具体使用的是均方误差算法来计算,公式如下:
其中n为样本数量,表示第i个原始数据,/>表示第i个重构数据,w,b为待训练的权重参数。/>的值越小,说明模型重构数据与输入数据之间的差异越小,模型的性能越好。其中/>有如下等式:
使用均方误差算法来计算重构数据和原始输入数据的差异能够更好的进行差异分析。
205、根据训练样本集合和初始权重参数生成自编码网络隐层神经元的激活度集合;
当终端根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差之后,接下来即可根据训练样本集合和初始权重参数生成自编码网络隐层神经元的激活度集合。公式如下:
表示在输入数据/>第1次输入的情况下,稀疏自编码模型网络的隐藏层神经元/>的激活度。W和b为待训练参数,x为输入数据。
206、根据激活度集合和样本数量计算神经元在所有训练样本上的平均激活度;
当终端获取到稀疏自编码模型网络的每一个隐藏层神经元的激活度之后,即可根据激活度集合和样本数量计算神经元在所有训练样本上的平均激活度,公式如下:
其中,m为样本数量,为神经元j在所有训练样本上的平均激活度。
207、根据平均激活度和稀疏性参数生成KL散度误差;
终端计算完平均激活度之后,即可根据平均激活度和稀疏性参数生成KL散度误差,稀疏性参数(相当于平均激活度的目标值)是根据实际应用的经验来确定的,通常是一个接近于0的值,表示隐藏神经元中激活神经元的占比,具体的KL散度误差的计算公式如下:
本实施例中,若可以使得,则神经元j在所有训练样本上的平均激活度便是稀疏的。为了使得/>,使用KL散度衡量二者的距离,KL散度的值越大,两者相差越大。
208、计算损失函数关于解码器重构数据的第一梯度;
209、根据第一梯度和预设学习率并结合随机梯度下降算法更新解码器的初始权重参数;
210、计算损失函数关于第二输出数据的第二梯度,第二输出数据为编码器的输出数据;
211、根据第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数;
终端根据误差集合生成损失函数KL散度误差和均方误差算法计算出来的第一误差进行整合,得到损失函数的表达式,本实施例中的损失函数的表达式如下:
其中,为代价函数,即为均方误差表达式。
终端根据KL散度误差和第一误差(均方误差)生成损失函数之后,即可通过梯度对编码器和解码器进行更新。具体的,终端计算损失函数关于解码器重构数据的第一梯度,并且根据第一梯度和预设学习率并结合随机梯度下降算法更新解码器的初始权重参数。即使用解码器生成的重构数据进行求导,从而生成第一梯度,并且根据该第一梯度更新解码器中的权重参数。
接下来,终端计算损失函数关于第二输出数据的第二梯度,第二输出数据为编码器的输出数据,最后根据第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数。即通过编码器生成的数据对损失函数进行求导,生成第二梯度,并使用第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数。
本实施例中,对损失函数进行求导获取梯度的公式之一如下:
其中,表示第i个训练样本编码器输出或者解码器输出,t表示第几个数。
散度项求导的公式如下:
将二者结合,因此,稀疏自编码的反向传播结果如下:
根据上述公式即可更新训练参数w和b。
(Stochastic Gradient Descent,SGD)来最小化损失函数。权重更新规则通常如下:
其中表示第t个step第i个权值更新前的值,/>表示第t+1个step第i个权值更新后的值/>表示其在第t个step的更新梯度,η表示学习率,它决定了沿着能让损失函数下降程度最大的方向向下迈出的步子有多大。
假设权重参数矩阵θ为[w1,w2, ...b1...],则θ更新方式如图8所示。
212、更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件;
本实施例中的步骤213与前述实施例中步骤107类似,此处不再赘述。
213、获取Micro-LED外观图像;
214、对Micro-LED外观图像采用传统AOI算法进行灯珠初筛,生成AOI检测结果,同时获取灯珠截图;
215、将的灯珠截图输入稀疏自编码模型进行缺陷检测,获取AI检测结果;
216、将AOI检测结果与AI检测结果进行整合,并反算到Micro-LED外观图像上,得到目标检测结果。
本实施例中还提出的一种基于稀疏自编码器的显示器像素点外观缺陷检测方法的主要检测流程如下:
1、图像获取:利用光学系统获取高精度的Micro-LED外观图像,一个Micro-LED产品可能会拍摄多张图像,需要保证每张Micro-LED外观图像上的灯珠清晰可见。此处用的光学系统包括光源、相机、镜头等元器件;
2、图像预处理:通过步骤1获取的Micro-LED外观图像,对Micro-LED外观图像的预处理主要目的是校正图像,去除一些背景噪声的干扰;
3、传统AOI算法检出:针对Micro-LED外观图像采用传统AOI算法进行灯珠初筛,降低后续深度网络模型的计算压力,同时获取灯珠截图,灯珠截图通过对Micro-LED外观图像中每一个灯珠区域进行截取划分,筛除背景区域的同时,后续对每一个灯珠图像进行单独AI检测,提高了精准度;
4、AI算法检出:此处的AI算法即本实施例提出的稀疏自编码模型的显示器像素点外观缺陷检测方法。步骤3获取的灯珠截图后送入AI算法进行缺陷检测,获取AI检测结果;
5、结果整合:将传统AOI算法检出的结果与AI算法检出的结果通过一定的对应关系整合一起,并反算到Micro-LED外观图像上。具体的,需要对AOI检测结果和AI检测结果进行重合度的比对,将两个检测结果中最高的两个检测结果进行对比,如果相同,则表示Micro-LED外观图像上存在该缺陷,如果未能一致,则根据每一个检测概率进行分析,以此得到最有可能的选项。
本实施例中,首先获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像,只需要获取到正常灯珠的图像即可。接下来,构建稀疏自编码模型并设置稀疏性参数和初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层。然后将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据。根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差。根据训练样本集合和初始权重参数生成自编码网络隐层神经元的激活度集合。根据激活度集合和样本数量计算神经元在所有训练样本上的平均激活度。根据平均激活度和稀疏性参数生成KL散度误差。计算损失函数关于解码器重构数据的第一梯度。根据第一梯度和预设学习率并结合随机梯度下降算法更新解码器的初始权重参数。计算损失函数关于第二输出数据的第二梯度,第二输出数据为编码器的输出数据。根据第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数。更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
获取Micro-LED外观图像。对Micro-LED外观图像采用传统AOI算法进行灯珠初筛,生成AOI检测结果,同时获取灯珠截图。将的灯珠截图输入稀疏自编码模型进行缺陷检测,获取AI检测结果。将AOI检测结果与AI检测结果进行整合,并反算到Micro-LED外观图像上,得到目标检测结果。
通过在编码器中构建卷积层和稀疏限制组,构建了一个无监督神经网络模型,通过一个深度神经网络(带稀疏限制组的编码器)来学习数据的低维表示,并使用另一个神经网络(解码器)来将这个低维表示转换回原始数据。通过最小化重构数据与原始数据之间的误差来还原输入数据,从而对输入数据进行分析判断。无需大规模地对训练样本进行严格的标记数据,同时避免了引入噪声标签,只需要少量的正常产品的图像数据进行训练,即可得到很好的检测效果,提高了训练过程速度和精准度。
其次,本实施例中提出的基于稀疏自编码器的显示器像素点外观缺陷检测方法无需大规模标记数据,且稀疏性限制可以大大提升模型的复杂度,提取更全面更深层次的特征,增强网络的拟合能力。同时,该方法有更高的数据利用率,针对新出现的缺陷类型也能同样检出,提高了自动检测设备的适应性。
请参阅图4,本申请提供了一种稀疏自编码模型的训练方法的一个实施例,包括:
第一获取单元401,用于获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像;
构建单元402,用于构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;
输入单元403,用于将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;
第一生成单元404,用于根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合;
第二生成单元405,用于根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数;
迭代单元406,用于更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
请参阅图5,本申请提供了一种稀疏自编码模型的训练方法的一个实施例,包括:
第一获取单元501,用于获取训练样本集合,训练样本集合包括若干张正常灯珠样本图像;
构建单元502,用于构建稀疏自编码模型并设置初始权重参数,稀疏自编码模型包括编码器和解码器,编码器包括卷积层、稀疏限制组和池化层,解码器包括反卷积层和反池化层;
输入单元503,用于将训练样本集合作为输入数据输入稀疏自编码模型中,根据初始权重参数获取稀疏自编码模型输出的解码器重构数据;
第一生成单元504,用于根据输入数据、解码器重构数据和初始权重参数进行差异计算,生成误差集合;
可选的,误差集合包括第一误差和KL散度误差;
第一生成单元504,包括:
第一生成模块5041,用于根据输入数据和解码器重构数据结合样本数量信息进行差异的计算,生成第一误差;
可选的,第一误差为均方误差;
第一生成模块5041,包括:
根据输入数据和解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差。
第二生成模块5042,用于根据输入数据和初始权重参数生成稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度;
可选的,第二生成模块5042,包括:
根据训练样本集合和初始权重参数生成自编码网络隐层神经元的激活度集合;
根据激活度集合和样本数量计算神经元在所有训练样本上的平均激活度。
第三生成模块5043,用于根据平均激活度和稀疏性参数生成KL散度误差。
第二生成单元505,用于根据误差集合和损失函数逐层反向传递更新稀疏自编码模型的权重参数;
可选的,第二生成单元505,包括:
计算损失函数关于解码器重构数据的第一梯度;
根据第一梯度和预设学习率并结合随机梯度下降算法更新解码器的初始权重参数;
计算损失函数关于第二输出数据的第二梯度,第二输出数据为编码器的输出数据;
根据第二梯度和预设学习率并结合随机梯度下降算法更新编码器的初始权重参数。
迭代单元506,用于更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件;
第二获取单元507,用于获取Micro-LED外观图像;
第三生成单元508,用于对Micro-LED外观图像采用传统AOI算法进行灯珠初筛,生成AOI检测结果,同时获取灯珠截图;
第三获取单元509,用于将的灯珠截图输入稀疏自编码模型进行缺陷检测,获取AI检测结果;
整合单元510,用于将AOI检测结果与AI检测结果进行整合,并反算到Micro-LED外观图像上,得到目标检测结果。
请参阅图6,本申请提供了一种电子设备,包括:
处理器601、存储器603、输入输出单元602以及总线604。
处理器601与存储器603、输入输出单元602以及总线604相连。
存储器603保存有程序,处理器601调用程序以执行如图1、图2和图3、中的训练方法。
本申请提供了一种计算机可读存储介质,计算机可读存储介质上保存有程序,程序在计算机上执行时执行如图1、图2和图3中的训练方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种稀疏自编码模型的训练方法,其特征在于,包括:
获取训练样本集合,所述训练样本集合包括若干张正常灯珠样本图像;
构建稀疏自编码模型并设置初始权重参数,所述稀疏自编码模型包括编码器和解码器,所述编码器包括卷积层、稀疏限制组和池化层,所述解码器包括反卷积层和反池化层;
将所述训练样本集合作为输入数据输入所述稀疏自编码模型中,根据所述初始权重参数获取所述稀疏自编码模型输出的解码器重构数据;
根据所述输入数据、所述解码器重构数据和所述初始权重参数进行差异计算,生成误差集合;
根据所述误差集合和损失函数逐层反向传递更新所述稀疏自编码模型的权重参数;
更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
2.根据权利要求1所述的训练方法,其特征在于,所述误差集合包括第一误差和KL散度误差;
根据所述输入数据、所述解码器重构数据和所述初始权重参数进行差异计算,生成误差集合,包括:
根据所述输入数据和所述解码器重构数据结合样本数量信息进行差异的计算,生成第一误差;
根据所述输入数据和所述初始权重参数生成所述稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度;
根据所述平均激活度和稀疏性参数生成KL散度误差。
3.根据权利要求2所述的训练方法,其特征在于,根据所述输入数据和所述初始权重参数生成所述稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度,包括:
根据所述训练样本集合和所述初始权重参数生成自编码网络隐层神经元的激活度集合;
根据所述激活度集合和样本数量计算神经元在所有训练样本上的平均激活度。
4.根据权利要求2所述的训练方法,其特征在于,所述第一误差为均方误差;
根据所述输入数据和所述解码器重构数据结合样本数量信息进行差异的计算,生成第一误差,包括:
根据所述输入数据和所述解码器重构数据结合样本数量信息进行均方误差计算,生成第一误差。
5.根据权利要求1至4中和任一项所述的训练方法,其特征在于,根据所述误差集合和损失函数逐层反向传递更新所述稀疏自编码模型的权重参数,包括:
计算损失函数关于所述解码器重构数据的第一梯度;
根据所述第一梯度和预设学习率并结合随机梯度下降算法更新所述解码器的初始权重参数;
计算损失函数关于第二输出数据的第二梯度,所述第二输出数据为所述编码器的输出数据;
根据所述第二梯度和预设学习率并结合随机梯度下降算法更新所述编码器的初始权重参数。
6.根据权利要求1至4中和任一项所述的训练方法,其特征在于,在所述更新完成后重复迭代的环节,直到稀疏自编码模型达到预设条件之后,所述训练方法还包括:
获取Micro-LED外观图像;
对所述Micro-LED外观图像采用传统AOI算法进行灯珠初筛,生成AOI检测结果,同时获取灯珠截图;
将所述的灯珠截图输入稀疏自编码模型进行缺陷检测,获取AI检测结果;
将所述AOI检测结果与AI检测结果进行整合,并反算到所述Micro-LED外观图像上,得到目标检测结果。
7.一种稀疏自编码模型的训练装置,其特征在于,包括:
第一获取单元,用于获取训练样本集合,所述训练样本集合包括若干张正常灯珠样本图像;
构建单元,用于构建稀疏自编码模型并设置初始权重参数,所述稀疏自编码模型包括编码器和解码器,所述编码器包括卷积层、稀疏限制组和池化层,所述解码器包括反卷积层和反池化层;
输入单元,用于将所述训练样本集合作为输入数据输入所述稀疏自编码模型中,根据所述初始权重参数获取所述稀疏自编码模型输出的解码器重构数据;
第一生成单元,用于根据所述输入数据、所述解码器重构数据和所述初始权重参数进行差异计算,生成误差集合;
第二生成单元,用于根据所述误差集合和损失函数逐层反向传递更新所述稀疏自编码模型的权重参数;
迭代单元,用于更新完成后,重复迭代的环节,直到稀疏自编码模型达到预设条件。
8.根据权利要求7所述的训练装置,其特征在于,所述误差集合包括第一误差和KL散度误差;
第一生成单元,包括:
第一生成模块,用于根据所述输入数据和所述解码器重构数据结合样本数量信息进行差异的计算,生成第一误差;
第二生成模块,用于根据所述输入数据和所述初始权重参数生成所述稀疏自编码模型的神经元在所有灯珠样本图像上的平均激活度;
第三生成模块,用于根据所述平均激活度和稀疏性参数生成KL散度误差。
9.一种电子设备,其特征在于,包括处理器、存储器、输入输出单元以及总线,所述处理器与所述存储器、所述输入输出单元以及所述总线相连;
所述存储器保存有程序,所述处理器调用所述程序以执行如权利要求1至6中任意一项所述的训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上保存有程序,所述程序在计算机上执行时执行如权利要求1至6中任一项所述的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410445122.5A CN118036669A (zh) | 2024-04-15 | 2024-04-15 | 一种稀疏自编码模型的训练方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410445122.5A CN118036669A (zh) | 2024-04-15 | 2024-04-15 | 一种稀疏自编码模型的训练方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118036669A true CN118036669A (zh) | 2024-05-14 |
Family
ID=90991850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410445122.5A Pending CN118036669A (zh) | 2024-04-15 | 2024-04-15 | 一种稀疏自编码模型的训练方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118036669A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503654A (zh) * | 2016-10-24 | 2017-03-15 | 中国地质大学(武汉) | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
CN113610158A (zh) * | 2021-08-09 | 2021-11-05 | 张家港迅见信息技术有限公司 | 一种深度堆栈式混合自编码网络的数据训练方法 |
CN114186583A (zh) * | 2021-12-02 | 2022-03-15 | 国家石油天然气管网集团有限公司 | 一种储油罐罐壁腐蚀检测异常信号恢复方法及系统 |
-
2024
- 2024-04-15 CN CN202410445122.5A patent/CN118036669A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106503654A (zh) * | 2016-10-24 | 2017-03-15 | 中国地质大学(武汉) | 一种基于深度稀疏自编码网络的人脸情感识别方法 |
CN113610158A (zh) * | 2021-08-09 | 2021-11-05 | 张家港迅见信息技术有限公司 | 一种深度堆栈式混合自编码网络的数据训练方法 |
CN114186583A (zh) * | 2021-12-02 | 2022-03-15 | 国家石油天然气管网集团有限公司 | 一种储油罐罐壁腐蚀检测异常信号恢复方法及系统 |
Non-Patent Citations (1)
Title |
---|
王金平: "基于深度卷积稀疏自编码分层网络的人脸识别技术", 太原理工大学学报, vol. 49, no. 5, 15 September 2018 (2018-09-15), pages 765 - 770 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106875373B (zh) | 基于卷积神经网络剪枝算法的手机屏幕mura缺陷检测方法 | |
CN111553929B (zh) | 基于融合网络的手机屏幕缺陷分割方法、装置及设备 | |
CN108108768B (zh) | 基于卷积神经网络的光伏玻璃缺陷分类方法及装置 | |
CN111275660B (zh) | 一种平板显示器缺陷检测方法及装置 | |
CN112561910A (zh) | 一种基于多尺度特征融合的工业表面缺陷检测方法 | |
CN111242026B (zh) | 一种基于空间层次感知模块和度量学习的遥感图像目标检测方法 | |
KR20200039049A (ko) | 외관불량 검사방법 및 외관불량 검사 시스템 | |
CN114240939A (zh) | 一种主板元器件外观缺陷检测方法、系统、设备及介质 | |
CN112446869A (zh) | 基于深度学习的无监督工业品缺陷检测方法及装置 | |
CN111209858A (zh) | 一种基于深度卷积神经网络的实时车牌检测方法 | |
CN115880298A (zh) | 一种基于无监督预训练的玻璃表面缺陷检测方法及系统 | |
CN108615401B (zh) | 基于深度学习的室内非均匀光线车位状况识别方法 | |
CN112149535A (zh) | 一种结合SegNet和U-Net的车道线检测方法和装置 | |
WO2024021461A1 (zh) | 缺陷检测方法及装置、设备、存储介质 | |
CN111105389A (zh) | 融合Gabor滤波器与卷积神经网络的路面裂缝的检测方法 | |
CN113822842A (zh) | 一种基于多任务学习的工业缺陷检测方法 | |
CN116994044A (zh) | 一种基于掩码多模态生成对抗网络的图像异常检测模型的构建方法 | |
CN112070762A (zh) | 液晶面板的mura缺陷检测方法、装置、存储介质及终端 | |
CN115797314B (zh) | 零件表面缺陷检测方法、系统、设备及存储介质 | |
CN118036669A (zh) | 一种稀疏自编码模型的训练方法、装置、设备和介质 | |
CN116385293A (zh) | 基于卷积神经网络的雾天自适应目标检测方法 | |
CN116051831A (zh) | 基于VSA-UNet的电气设备紫外图像分割方法 | |
CN115345842A (zh) | 一种基于深度学习的汽车关键部件相似比对方法 | |
CN114627435A (zh) | 基于图像识别的智能灯光调节方法、装置、设备及介质 | |
CN114897909A (zh) | 基于无监督学习的曲轴表面裂纹监测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |