CN116630310B - 一种石英玻璃的检测方法、装置、设备及介质 - Google Patents
一种石英玻璃的检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116630310B CN116630310B CN202310897131.3A CN202310897131A CN116630310B CN 116630310 B CN116630310 B CN 116630310B CN 202310897131 A CN202310897131 A CN 202310897131A CN 116630310 B CN116630310 B CN 116630310B
- Authority
- CN
- China
- Prior art keywords
- feature map
- feature
- image
- enhancement
- weight matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 70
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 title claims abstract description 63
- 230000004927 fusion Effects 0.000 claims abstract description 95
- 238000000034 method Methods 0.000 claims abstract description 48
- 230000010287 polarization Effects 0.000 claims abstract description 29
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims description 152
- 238000012545 processing Methods 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 37
- 238000013507 mapping Methods 0.000 claims description 37
- 230000004913 activation Effects 0.000 claims description 36
- 230000003213 activating effect Effects 0.000 claims description 35
- 238000011176 pooling Methods 0.000 claims description 32
- 230000002708 enhancing effect Effects 0.000 claims description 25
- 238000004590 computer program Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 7
- 238000001994 activation Methods 0.000 description 36
- 230000006870 function Effects 0.000 description 23
- 230000007547 defect Effects 0.000 description 22
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 9
- 230000005284 excitation Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000002349 favourable effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000012239 silicon dioxide Nutrition 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P40/00—Technologies relating to the processing of minerals
- Y02P40/50—Glass production, e.g. reusing waste heat during processing or shaping
- Y02P40/57—Improving the yield, e-g- reduction of reject rates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Processing (AREA)
Abstract
本发明涉及人工智能技术领域,尤其涉及一种石英玻璃的检测方法、装置、设备及介质。通过获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,根据第一图像与第二图像,计算图像增强后的融合特征图,得到第一融合特征图,根据第一融合特征图与选取的K个特征点,进行局部增强,得到第三增强特征图与第四增强特征图,通过迭代计算,得到每次迭代的增强特征图,根据每次迭代的增强特征图进行检测,本申请中,使用石英玻璃的光强特征图与偏振特征图的多模态数据,通过全局特征增强与局部特征增强将不同模态数据进行特征融合,提高了微小特征的提取能力,根据融合特征进行检测,从而提高了石英玻璃的检测准确度。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种石英玻璃的检测方法、装置、设备及介质。
背景技术
石英玻璃是由二氧化硅单一组分构成的特种工业技术玻璃,在光学、机械、电学、热学、化学等多方面都具有普通玻璃无可比拟的优异性能,被新材料领域专家誉为“玻璃之王”,是半导体、光学、光伏等国家战略性新兴产业和航空航天等国防领域不可替代的基础性材料。但半导体等高端领域对所用石英玻璃的制造纯度和工艺水平要求非常之高,会对所用石英玻璃中气泡、气线、麻点、色斑等工艺缺陷和杂质含量进行缺陷检测。
现有技术中,对石英玻璃进行缺陷检测时,一般使用单一模态数据进行检测,由于环境、光照、生产过程和噪声等多重因素影响,使用单一模态数据进行检测时部分工艺缺陷特征难以提取或无法与噪声有效区分,且容易受到不利外部环境变化的干扰,使检测准确率较低,因此,如何提高石英玻璃的缺陷检测准确度成为亟需解决的问题。
发明内容
有鉴于此,本申请实施例提供了一种石英玻璃的检测方法、装置及介质,以解决在对石英玻璃的检测时,检测准确度较低的问题。
第一方面,本申请实施例提供一种石英玻璃的检测方法,所述检测方法包括:
获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图;
对所述第一特征图进行权重计算,得到第一特征权重矩阵,对所述第二特征图进行权重计算,得到第二特征权重矩阵;
使用所述第一特征权重矩阵对所述第一特征图进行增强,得到第一增强特征图,使用所述第二特征权重矩阵对所述第二特征图进行增强,得到第二增强特征图,将所述第一增强特征图与所述第二增强特征图融合,得到第一融合特征图;
对所述第一融合特征图进行卷积,得到卷积特征图,从所述第一融合特征图中选取K个特征点,针对任一特征点,以所述特征点对所述卷积特征图进行观测,得到对应所述特征点的观测结果,K为大于1的整数;
根据所述第一融合特征图和所有特征点对应的观测结果,计算得到对应所述第一融合特征图的第三特征权重矩阵,根据所述第三特征权重矩阵对所述第一特征图与所述第二特征图进行激活,得到第三增强特征图与第四增强特征图;
将第三增强特征图作为所述第一图像,将第四增强特征图作为所述第二图像,返回执行对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图的步骤,直至迭代完成;
对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对所述第二融合特征图进行检测,得到检测结果。
第二方面,本申请实施例提供一种石英玻璃的检测装置,所述石英玻璃检测装置包括:
获取模块,用于获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图;
权重计算模块,用于对所述第一特征图进行权重计算,得到第一特征权重矩阵,对所述第二特征图进行权重计算,得到第二特征权重矩阵;
增强模块,用于使用所述第一特征权重矩阵对所述第一特征图进行增强,得到第一增强特征图,使用所述第二特征权重矩阵对所述第二特征图进行增强,得到第二增强特征图,将所述第一增强特征图与所述第二增强特征图融合,得到第一融合特征图;
观测模块,用于对所述第一融合特征图进行卷积,得到卷积特征图,从所述第一融合特征图中选取K个特征点,针对任一特征点,以所述特征点对所述卷积特征图进行观测,得到对应所述特征点的观测结果,K为大于1的整数;
激活模块,用于根据所述第一融合特征图和所有特征点对应的观测结果,计算得到对应所述第一融合特征图的第三特征权重矩阵,根据所述第三特征权重矩阵对所述第一特征图与所述第二特征图进行激活,得到第三增强特征图与第四增强特征图;
迭代模块,用于将所述第三增强特征图与所述第四增强特征图进行下采样处理,得到下采样后的第三增强特征图与下采样后的第四增强特征图,将所述下采样后的第三增强特征图作为所述第一图像,将下采样后的第四增强特征图作为所述第二图像,返回执行对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图的步骤,直至迭代完成;
融合模块,用于对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对所述第二融合特征图进行检测,得到检测结果。
第三方面,本发明实施例提供一种终端设备,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的石英玻璃的检测方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的石英玻璃的检测方法。
本发明与现有技术相比存在的有益效果是:
获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图,对第一特征图进行权重计算,得到第一特征权重矩阵,对第二特征图进行权重计算,得到第二特征权重矩阵,使用第一特征权重矩阵对第一特征图进行增强,得到第一增强特征图,使用第二特征权重矩阵对第二特征图进行增强,得到第二增强特征图,将第一增强特征图与第二增强特征图融合,得到第一融合特征图,对第一融合特征图进行卷积,得到卷积特征图,从第一融合特征图中选取K个特征点,针对任一特征点,以特征点对卷积特征图进行观测,得到对应特征点的观测结果,K为大于1的整数,根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图,将第三增强特征图作为第一图像,将第四增强特征图作为第二图像,返回执行对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图的步骤,直至迭代完成,对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对第二融合特征图进行检测,得到检测结果。本申请中,使用石英玻璃的光强特征图与偏振特征图的多模态数据,通过全局特征增强与局部特征增强将不同模态数据进行特征融合,提高了微小特征的提取能力,根据融合特征进行检测,从而提高了石英玻璃的检测准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例一提供的一种石英玻璃的检测方法的一应用环境示意图;
图2是本申请实施例一提供的一种石英玻璃的检测方法的流程示意图;
图3是本申请实施例二提供的一种石英玻璃的检测方法的流程示意图;
图4是本申请实施例三提供的一种石英玻璃的检测方法与其他缺陷检测模型在针对一高清工业相机获取的光强图像的检测效果对比图;
图5是本申请实施例四提供的一种石英玻璃的检测装置的结构框图。
图6是本申请实施例五提供的一种终端设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本发明说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本发明说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本发明说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本发明的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
本发明实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
应理解,以下实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
为了说明本发明的技术方案,下面通过具体实施例来进行说明。
本发明实施例一提供的一种石英玻璃的检测方法,可应用在如图1的应用环境中,其中,客户端与服务端进行通信。其中,客户端包括但不限于掌上电脑、桌上型计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本、个人数字助理(personal digital assistant,PDA)等终端设备。服务端可以用独立的服务器或者是多个服务器生成的服务器集群来实现。
参见图2,是本发明实施例一提供的一种石英玻璃的检测方法的流程示意图,上述石英玻璃的检测方法可以应用于图1中的服务端,上述服务端连接相应的客户端,如图2所示,该石英玻璃的检测方法可以包括以下步骤。
S201:获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图。
在步骤S201中,第一图像为表征光强特征的图像,第二图像为表征偏振特征的图像,对第一图像与第二图像进行卷积操作,提取第一图像中的光强深度特征与第二图像的偏振深度特征,得到对应第一图像的第一特征图与对应第二图像的第二特征图。
本实施例中,通过RGB相机对待检测石英玻璃进行拍照得到第一图像,通过偏振相机对待检测石英玻璃进行拍照得到对应第二图像。其中第一图像与第二图像的大小为C×H×W,其中,C为第一图像与第二图像的通道数,H为第一图像与第二图像的高度,W为第一图像与第二图像的宽度。将第一图像输入至3×3的卷积层1中,对第一图像进行卷积处理,得到第一特征图,将第二图像输入至3×3的卷积层2中,对第二图像进行卷积处理,得到第二特征图。
需要说明的是,卷积层1与卷积层2中的卷积核大小可以相同也可以不相同。
S202:对第一特征图进行权重计算,得到第一特征权重矩阵,对第二特征图进行权重计算,得到第二特征权重矩阵。
在步骤S202中,计算第一特征图与第二特征图的特征权重矩阵,以便于根据权重矩阵对第一特征图与第二特征图进行图像增强处理。
本实施例中,根据第一特征图计算权重矩阵,得到第一特征权重矩阵,第一特征权重矩阵为第一图像的激励特征值,表征了光强特征的激励特征值,根据第二特征图计算权重矩阵,得到第二特征权重矩阵,第二特征权重矩阵为第二图像的激励特征值,表征了偏振特征的激励特征值。得到光强特征的激励特征值与偏振特征的激励特征值,以便于根据光强特征的激励特征值对偏振特征图进行激励,根据偏振特征的激励特征值对光强特征进行激励,使多模态特征进行信息融合,达到图像增强的目的。
可选地,对第一特征图进行权重计算,得到第一特征权重矩阵,对第二特征图进行权重计算,得到第二特征权重矩阵,包括:
对第一特征图进行全局平均池化处理,得到第一平均池化特征图,对第一平均池化特征图进行空间投影,得到第一投影特征图;
将第一特征图进行空间投影,得到第二投影特征图,计算第一投影特征图与第二投影特征图之间的全局关联性,得到第一关联度矩阵;
对第二特征图进行全局平均池化处理,得到第二平均池化特征图,对第二平均池化特征图进行空间投影,得到第三投影特征图;
将第二特征图进行空间投影,得到第四投影特征图,计算第三投影特征图与第四投影特征图之间的全局关联性,得到第二关联度矩阵;
对第一关联度矩阵激活处理,得到对应第一特征权重矩阵,对第二关联度矩阵进行激活处理,得到对应第二特征权重矩阵。
本实施例中,对第一特征图进行全局平均池化处理时,在每个通道上分别进行全局平均池化处理,得到第一平均池化特征图,第一平均池化特征图的大小为C×1×1,C为通道数,对第一平均池化特征图进行空间投影映射,得到第一投影特征图,其中投影映射函数为。将三维的第一平均池化特征图转换为二维的第一投影特征图,降低了特征维度。对第一特征图直接进行空间投影映射,得到第二投影特征图,其中投影映射函数为/>,将三维第一特征图转换为二维的第二映射特征图,计算第一映射特征图与第二映射特征图之间的关联度信息,得到对应的第一关联度矩阵,在计算第一关联度信息时,将第一映射特征图与第二映射特征图进行相乘处理,得到对应的第一关联度矩阵,计算公式如下:/>,其中,/>为第一关联度矩阵,/>为第一映射特征图,为第二映射特征图,/>为1×HW的矩阵。
对第一关联度矩阵进行激活处理,得到对应第一特征权重矩阵。激活处理时,使用激活函数sigmoid进行激活处理,通过激活函数将第一关联度矩阵转换为权重值矩阵,计算公式如下:,其中,/>为第一特征权重矩阵,/>为第一关联度矩阵。
本实施例中,计算光强特征在不同投影空间下的映射特征之间的关联度信息,将关联度信息作为对应的权重值,关联度信息越大,权重值越大,关联度信息越小,权重值越小,从而提高第一图像中每个元素的权重值的计算精度。
对第二特征图进行全局平均池化处理时,在每个通道上分别进行全局平均池化处理,得到第二平均池化特征图,第二平均池化特征图的大小为C×1×1,C为通道数,对第二平均池化特征图进行空间投影映射,得到第三投影特征图,其中投影映射函数为。将三维的第二平均池化特征图转换为二维的第三投影特征图,降低了特征维度。对第二特征图直接进行空间投影映射,得到第四投影特征图,其中投影映射函数为/>,将三维第二特征图转换为二维的第四映射特征图,计算第三映射特征图与第四映射特征图之间的关联度信息,得到对应的第二关联度矩阵,在计算第二关联度信息时,将第三映射特征图与第四映射特征图进行相乘处理,得到对应的第二关联度矩阵,计算公式如下:/>,其中,/>为第二关联度矩阵,/>为第三映射特征图,/>为第四映射特征图,/>为1×HW的矩阵。
对第二关联度矩阵进行激活处理,得到对应第二特征权重矩阵。激活处理时,使用激活函数sigmoid进行激活处理,通过激活函数将第二关联度矩阵转换为权重值矩阵,计算公式如下:,其中,/>为第二特征权重矩阵,/>为第二关联度矩阵。
本实施例中,计算偏振特征在不同投影空间下的映射特征之间的关联度信息,将关联度信息作为对应的权重值,关联度信息越大,权重值越大,关联度信息越小,权重值越小,从而提高第二图像中每个元素的权重值的计算精度。
S203:使用第一特征权重矩阵对第一特征图进行增强,得到第一增强特征图,使用第二特征权重矩阵对第二特征图进行增强,得到第二增强特征图,将第一增强特征图与第二增强特征图融合,得到第一融合特征图。
在步骤S203中,使用第一特征权重矩阵对第二特征图进行增强处理,得到第一增强特征图,使用第二特征权重矩阵对第一特征图进行增强处理,得到第二增强特征图,即使用第一特征图得到的对应元素的权重值对第二特征图进行增强处理,使用第二特征图得到的对应元素的权重值对第一特征图进行增强处理,其中,将第一图像中的光强特征融合至第二图像中的偏振特征中,得到第一增强特征图,将第二图像中的偏振特征融合至第一图像中的光强特征中,得到第二增强特征图,将不同模态图像中的特征进行充分融合,从而得到待检测石英玻璃表面更准确的特征信息。
本实施例中,使用第一特征权重矩阵对第二特征图进行增强处理时,将第一特征权重矩阵与第二特征图进行点乘,得到对应的第一增强特征图,使用第二特征权重矩阵对第一特征图进行增强处理时,将第二特征权重矩阵与第一特征图进行点乘,得到第二增强特征图。将第一增强特征图与第二增强特征图融合,得到第一融合特征图,融合时,将第一增强特征图与第二增强特征图进行相加融合,以将光强特征与偏振特征进行充分融合。
S204:对第一融合特征图进行卷积,得到卷积特征图,从第一融合特征图中选取K个特征点,针对任一特征点,以特征点对卷积特征图进行观测,得到对应特征点的观测结果,K为大于1的整数。
在步骤S204中,在第一融合特征图中选取K个特征点,选取时,根据第一融合特征图的大小进行等比例选取,根据选取到的特征点,以特征点对卷积特征图进行观测,计算卷积特征图中每个像素在局部特征点的映射,得到对应特征点的观测结果。
本实施例中,对第一融合特征图进行卷积,得到卷积特征图,从第一融合特征图中选取K个特征点,本实施例中,K的取值可以为:,其中H为第一融合特征图的高度,W为第一融合特征图的宽度。针对任一特征点,以特征点对卷积特征图进行观测,计算卷积特征图中每个像素在局部特征点的映射,得到对应特征点的观测结果,以便于得到第一融合特征图的局部特征。
可选地,对第一融合特征图进行卷积,得到卷积特征图,包括:
对第一融合特征图进行卷积操作,得到初始卷积特征图;
对初始卷积特征图进行归一化处理,得到归一化特征图;
对归一化特征图进行激活处理,得到对应卷积特征图。
本实施例中,使用卷积网络对第一融合特征图进行卷积,卷积网络包括三个卷积层、归一化层与激活层,卷积层中卷积核的大小分别为1×1的卷积核、3×3的卷积核与1×1的卷积核,通过卷积层对第一图像进行卷积特征提取,得到初始卷积特征图,初始卷积特征图作为归一化层的输入,归一化层对初始卷积特征图进行归一化处理,得到归一化特征图,归一化特征图作为激活层的输入,激活层对归一化特征图进行激活处理,得到激活特征图,将激活特征图确定为对应卷积特征图,其中激活层的激活函数为ReLU激活函数。
可选地,针对任一特征点,以特征点对卷积特征图进行观测,得到对应特征点的观测结果,包括:
针对任一特征点,计算特征点与卷积特征图中每个像素点的差值;
根据差值与预设缩放因子,计算卷积特征图相对于特征点的映射值,将映射值作为对应特征点的观测结果。
本实施例中,将特征点的特征与卷积特征图中每个像素点的特征差值作为卷积特征图在特征点处的映射结果,所以,计算特征点与卷积特征图中每个像素点的差值,根据差值与预设缩放因子,计算卷积特征图相对于特征点的映射值,将映射值作为对应特征点的观测结果,该特征点的观测结果的计算公式如下:,其中,/>为第j个特征点对应的观测结果,/>为第j个特征点对应的预设缩放因子,/>为第j个特征点对应的特征值,/>为卷积特征图中第i个像素的像素值,K为特征点的个数,N为卷积特征图中像素的个数。需要说明的是,/>为通过网络训练得到的。
S205:根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图。
在步骤S205中,根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图,即将局部特征与全局特征进行融合计算权重值,以便提高特征图中局部特征提取能力。
本实施例中,根据每个特征点对应的观测结果,确定所有特征点对应的观测结果,根据第一融合特征图和所有特征点对应的观测结果,计算所有特征点对应的观测结果的激活权重值,使用激活权重值对第一融合特征图进行加权增强,得到融合增强特征图,对融合特征图再次进行激活处理,得到对应的第三特征权重矩阵,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图。
可选地,根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,包括:
将所有特征点对应的观测结果进行批归一化处理,得到对应归一化观测结果;
将归一化观测结果进行激活处理,得到激活观测结果;
将激活观测结果进行全局平均池化,得到特征点特征图;
根据第一融合特征图和特征点特征图,计算得到对应第一融合特征图的第三特征权重矩阵。
本实施例中,对所有特征点对应的观测结果进行卷积处理,卷积处理时,使用对应的卷积网络进行处理,卷积网络包括归一化层、激活层与全局平均池化层,将所有特征点对应的观测结果进行批归一化处理,得到对应归一化观测结果,将归一化观测结果进行激活处理,得到激活观测结果,其中激活层的激活函数为ReLU激活函数,将激活观测结果进行全局平均池化,得到特征点特征图,根据第一融合特征图和特征点特征图,计算得到对应第一融合特征图的第三特征权重矩阵。
可选地,根据第一融合特征图和特征点特征图,计算得到对应第一融合特征图的第三特征权重矩阵,包括:
对特征点特征图进行激活处理,得到特征权重矩阵;
使用特征权重矩阵对第一融合特征图进行增强,得到第一融合特征图的融合增强特征图;
对融合增强特征图进行激活处理,得到第三特征权重矩阵。
本实施例中,对特征点特征图进行激活处理时,首先将特征点特征图输入至全连接层中和1×1的卷积层,提取特征点特征图的局部特征,得到对应局部特征图,使用激活函数对局部特征图进行激活,得到特征权重矩阵,使用特征权重矩阵对第一融合特征图进行增强,得到第一融合特征图的融合增强特征图,融合增强特征图包含了光强特征与偏振特征的融合特征图,融合增强特征图的计算如下:,其中,/>为融合增强特征图,/>为第一融合特征图,/>为sigmoid激活函数,/>为1×1的卷积函数,/>为特征点特征图。
进一步,从融合增强特征图中提取出有利于增强光强图像特征部分的特征,以及有利于增强偏振图像特征部分的特征,并将有利于增强光强图像特征部分的特征与光强图像深度特征相融合,将有利于增强偏振图像特征部分的特征与偏振图像深度特征相融合,对融合增强特征图进行激活处理,得到第三特征权重矩阵,在进行激活之前还需要对融合增强特征图进行全局平均池化,得到池化特征图,对池化特征图进行激活处理,得到第三特征权重矩阵。第三特征权重矩阵的计算公式如下:,其中,/>为第三特征权重矩阵,/>为sigmoid激活函数,/>为全局平均池化函数,/>为融合增强特征图。
可选地,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图,包括:
使用第三特征权重矩阵对第一特征图进行增强,得到对应第三增强特征图;
根据预设阈值与第三特征权重矩阵,计算第四权重矩阵;
使用第四权重矩阵对第二特征图进行增强,得到对应第四增强特征图。
本实施例中,第三特征权重矩阵作为权重值对第一特征图进行增强,得到对应第三增强特征图,根据预设阈值与第三特征权重矩阵,计算第四权重矩阵,其中据预设阈值为1,使用第四权重矩阵对第二特征图进行增强,得到对应第四增强特征图。需要说明的是,进行增强处理时,将对应的特征权重矩阵与特征图进行点乘,得到对应增强特征图。
S206:将第三增强特征图与第四增强特征图进行下采样处理,得到下采样后的第三增强特征图与下采样后的第四增强特征图,将下采样后的第三增强特征图作为第一图像,将下采样后的第四增强特征图作为第二图像,返回执行对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图的步骤,直至迭代完成。
在步骤S206中,进行迭代处理,得到每次迭代对应的下采样后的第三增强特征图与第四增强特征图,直至迭代完成,迭代次数可以进行任意设置。
本实施例中,迭代次数为4,将第三增强特征图与第四增强特征图进行下采样处理,得到下采样后的第三增强特征图与下采样后的第四增强特征图,将下采样后的第三增强特征图作为第一图像,将下采样后的第四增强特征图作为第二图像进行迭代处理,执行对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图,依次进行4次,得到4个第三增强特征图与第四增强特征图。
S207:对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对第二融合特征图进行检测,得到检测结果。
在步骤S207中,将得到的所有的第三增强特征图与第四增强特征图进行相加融合,得到对应的第二融合特征图,对第二融合特征图进行缺陷检测,得到检测结果。
本实施例中,将四次迭代得到的4个第三增强特征图与第四增强特征图进行相加融合,得到第二融合特征图,使用缺陷检测模型进行检测,本实施例中,使用分类回归算法,对第二融合特征图进行缺陷分类处理,其中分类回归算法为logistic回归算法,logistic回归算法通过直接最大化类别的后验概率来学习一个线性分类函数,该logistic回归算法性能与线性SVM相当,但与其他线性分类不同的是,该方法无需保存任何训练样本,在检测时的效率大大提高。
边界框回归算法,对第二融合特征图进行缺陷定位处理,得到待检测石英玻璃中的缺陷位置,边界框回归算法可以为YOLOV3的边界框回归算法。YOLOV3的边界框回归算法在检测过程中首先将输入图像划分成 S×S 个大小相同的单元格,每个单元格只负责对中心位于该单元格中的目标进行预测,一个单元格预测 B 个边界框,每个边界框中包含的信息为目标中心点相对于点所在单元格左上角的偏移量tx与ty,以及预测边界框的宽度tw和高度th,然后通过反向传播计算来更新tx,ty,tw,th的取值,进而获得预测的边界框。这种边界框回归算法利用预先定义的锚框直接将整张图像作为输入进行训练,省去生成候选区域的中间步骤,能够快速区分背景区域和目标,从而实现对目标的快速检测。
需要说明的是,在对检测模型进行训练时,利用高清工业相机及偏振相机采集了石英玻璃的光强图像数据与偏振图像数据。并针对多种不同的缺陷,手动标注了缺陷的位置信息,数据集构建了包括2000张石英玻璃光强图像及2000张相对应的石英玻璃偏振图像,包含各类石英玻璃缺陷目标,图像分辨率为512×512。我们在Pytorch框架下使用Adam优化器以及交叉熵损失函数对模型进行训练。使用Windows 10操作系统,两个NVIDIAQuadro M5000图形处理单元(GPU)。网络的初始训练参数如表1所示:
表1
将数据集采用7:3的比例分为训练集和测试集。然后,使用对应的缺陷检测网络进行实验。为了得到更准确的检测结果,使用多缺陷检测网络对比实验,实验结果如表2所示:
表2
其中,全类平均精度的计算公式如下:,其中,/>表示精确率,/>表示召回率,/>表示单类别平均精度,/>表示全类平均精度,N表示检测的缺陷类别数目,/>表示预测正确的样本数量,即 IoU >0.5的检测框数量,/>表示将错误样本预测为正确样本的数量,即IoU<=0.5的检测框,/>为将正确样本预测为错误样本的数量,即没有检测到的缺陷的数量。
根据表2中各个缺陷检测模型中的缺陷检测准确率对比,可知,本发明方法中的检测模型的缺陷检测精度,召回率与全类平均精度比现有技术中检测精度都高,所以本申请中石英玻璃的检测方法具有显著的有益效果。
参见图3,是本申请实施例二提供的一种石英玻璃的检测方法的流程示意图,其中,获取光强特征的第一图像,与偏振图像特征的第二图像/>,分别对第一图像/>,与第二图像/>进行两次的卷积操作,得到第一图像/>的第一特征图/>与第三特征图,以及第二图像/>的第二特征图/>与第四特征图/>,对第一特征图/>进行全局池化操作与维度转换得到/>,对第一特征图/>进行维度转换得到/>,对/>与/>进行矩阵相乘,得到关联度矩阵/>,对关联度矩阵/>进行激活,得到第一特征权重矩阵/>。对第二特征图/>进行全局池化操作与维度转换得到/>,对第二特征图/>进行维度转换得到/>,对/>与/>进行矩阵相乘,得到关联度矩阵/>,对关联度矩阵/>进行激活,得到第二特征权重矩阵/>。使用第一特征权重矩阵/>对第二特征图/>进行点乘增强,得到第一增强特征图/>,使用第二特征权重矩阵/>对第一特征图/>进行点乘增强,得到第二增强特征图/>将第一增强特征图/>与第二增强特征图/>融合,得到第一融合特征图。
对第一融合特征图进行卷积,得到卷积特征图,从第一融合特征图中选取K个特征点(,,),针对任一特征点,以特征点对卷积特征图进行观测,得到对应特征点的观测结果(,,)/>,根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,根据第三特征权重矩阵对第三特征图/>与第四特征图/>进行增强,得到第三增强特征图与第四增强特征图,将第三增强特征图与第四增强特征图进行下采样处理,得到下采样后的第三增强特征图/>与下采样后的第四增强特征图/>。将下采样后的第三增强特征图/>作为第一图像/>,将下采样后的第四增强特征图/>作为第二图像/>,返回执行对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图的步骤,直至迭代完成。
参见图4,是本申请实施例三提供的一种石英玻璃的检测方法与其他缺陷检测模型在针对一高清工业相机获取的光强图像的检测效果对比图。光强图像为待检测石英玻璃图像,由图4可知,使用VGG16模型对待检测石英玻璃进行检测时,得到1检测结果,使用YOLOV5模型对待检测石英玻璃进行检测时,得到2个检测结果,使用MobileNetv2模型对待检测石英玻璃进行检测时,得到2个检测结果,使用本发明方法模型对待检测石英玻璃进行检测时,得到3个检测结果,根据对比结果图可知,本发明方法具有显著的有益效果。
获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图,对第一特征图进行权重计算,得到第一特征权重矩阵,对第二特征图进行权重计算,得到第二特征权重矩阵,使用第一特征权重矩阵对第一特征图进行增强,得到第一增强特征图,使用第二特征权重矩阵对第二特征图进行增强,得到第二增强特征图,将第一增强特征图与第二增强特征图融合,得到第一融合特征图,对第一融合特征图进行卷积,得到卷积特征图,从第一融合特征图中选取K个特征点,针对任一特征点,以特征点对卷积特征图进行观测,得到对应特征点的观测结果,K为大于1的整数,根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图,将第三增强特征图作为第一图像,将第四增强特征图作为第二图像,返回执行对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图的步骤,直至迭代完成,对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对第二融合特征图进行检测,得到检测结果。本申请中,使用石英玻璃的光强特征图与偏振特征图的多模态数据,通过全局特征增强与局部特征增强将不同模态数据进行特征融合,提高了微小特征的提取能力,根据融合特征进行检测,从而提高了石英玻璃的检测准确度。
需要说明的是,本申请实施例提出的石英玻璃的检测方法,可适用于各种各样的计算机智能处理任务中,包括但不局限于目标检测、目标分类等各类应用场景的智能处理任务中,具体不做限定。
示例性的,上述智能处理任务,具体可应用于包括但不局限于半导体等微、纳米级别等图像分析、检测和目标分类处理场景中,比如,具体可应用于半导体检测中,具体本申请实施例不做限定。比如,如若应用于目标检测应用场景中,则可利用本申请提供的石英玻璃的检测方法最终得到的输出图像特征,进行目标检测处理,得到目标检测结果。
对应于上文实施例的一种石英玻璃的检测方法,图5出了本申请实施例四提供的一种石英玻璃的检测装置的结构框图,上述检测装置应用于上述服务端。为了便于说明,仅示出了与本申请实施例相关的部分。参见图5,该检测装置50包括:获取模块51,权重计算模块52,增强模块53,观测模块54,激活模块55,迭代模块56,融合模块57。
获取模块51,用于获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图。
权重计算模块52,用于对第一特征图进行权重计算,得到第一特征权重矩阵,对第二特征图进行权重计算,得到第二特征权重矩阵。
增强模块53,用于使用第一特征权重矩阵对第一特征图进行增强,得到第一增强特征图,使用第二特征权重矩阵对第二特征图进行增强,得到第二增强特征图,将第一增强特征图与第二增强特征图融合,得到第一融合特征图。
观测模块54,用于对第一融合特征图进行卷积,得到卷积特征图,从第一融合特征图中选取K个特征点,针对任一特征点,以特征点对卷积特征图进行观测,得到对应特征点的观测结果,K为大于1的整数。
激活模块55,用于根据第一融合特征图和所有特征点对应的观测结果,计算得到对应第一融合特征图的第三特征权重矩阵,根据第三特征权重矩阵对第一特征图与第二特征图进行激活,得到第三增强特征图与第四增强特征图。
迭代模块56,用于将第三增强特征图与第四增强特征图进行下采样处理,得到下采样后的第三增强特征图与下采样后的第四增强特征图,将下采样后的第三增强特征图作为第一图像,将下采样后的第四增强特征图作为第二图像,返回执行对第一图像与第二图像分别进行特征提取,得到对应第一图像的第一特征图与对应第二图像的第二特征图的步骤,直至迭代完成。
融合模块57,用于对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对第二融合特征图进行检测,得到检测结果。
可选地,上述权重计算模块52包括:
第一池化单元,用于对第一特征图进行全局平均池化处理,得到第一平均池化特征图,对第一平均池化特征图进行空间投影,得到第一投影特征图。
第一投影单元,用于将第一特征图进行空间投影,得到第二投影特征图,计算第一投影特征图与第二投影特征图之间的全局关联性,得到第一关联度矩阵。
第二池化单元,用于对第二特征图进行全局平均池化处理,得到第二平均池化特征图,对第二平均池化特征图进行空间投影,得到第三投影特征图。
第二投影单元,用于将第二特征图进行空间投影,得到第四投影特征图,计算第三投影特征图与第四投影特征图之间的全局关联性,得到第二关联度矩阵。
激活单元,用于对第一关联度矩阵激活处理,得到对应第一特征权重矩阵,对第二关联度矩阵进行激活处理,得到对应第二特征权重矩阵。
可选地,上述观测模块54包括:
卷积单元,用于对第一融合特征图进行卷积操作,得到初始卷积特征图。
第一归一化单元,用于对初始卷积特征图进行归一化处理,得到归一化特征图。
第一激活单元,用于对归一化特征图进行激活处理,得到对应卷积特征图。
可选地,上述观测模块54包括:
差值计算单元,用于针对任一特征点,计算特征点与卷积特征图中每个像素点的差值。
映射单元,用于根据差值与预设缩放因子,计算卷积特征图相对于特征点的映射值,将映射值作为对应特征点的观测结果。
可选地,上述激活模块55包括:
第二归一化单元,用于将所有特征点对应的观测结果进行批归一化处理,得到对应归一化观测结果。
第二激活单元,用于将归一化观测结果进行激活处理,得到激活观测结果。
第三池化单元,用于将激活观测结果进行全局平均池化,得到特征点特征图。
权重计算单元,用于根据第一融合特征图和特征点特征图,计算得到对应第一融合特征图的第三特征权重矩阵。
可选地,上述权重计算单元包括:
第三激活单元,用于对特征点特征图进行激活处理,得到特征权重矩阵。
增强单元,用于使用特征权重矩阵对第一融合特征图进行增强,得到第一融合特征图的融合增强特征图。
第四激活单元,用于对融合增强特征图进行激活处理,得到第三特征权重矩阵。
可选地,上述激活模块55包括:
第一计算单元,用于使用第三特征权重矩阵对第一特征图进行增强,得到对应第三增强特征图。
第二计算单元,用于根据预设阈值与第三特征权重矩阵,计算第四权重矩阵。
得到单元,用于使用第四权重矩阵对第二特征图进行增强,得到对应第四增强特征图。
需要说明的是,上述模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
图6为本申请实施例五提供的一种终端设备的结构示意图。如图6所示,该实施例的终端设备包括:至少一个处理器(图6中仅示出一个)、存储器以及存储在存储器中并可在至少一个处理器上运行的计算机程序,处理器执行计算机程序时实现上述任意各个石英玻璃的检测方法实施例中的步骤。
该终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,图6仅仅是终端设备的举例,并不构成对终端设备的限定,终 端设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括网络接口、显示屏和输入装置等。
所称处理器可以是CPU,该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器包括可读存储介质、内存储器等,其中,内存储器可以是终端设备的内存,内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。可读存储介质可以是终端设备的硬盘,在另一些实施例中也可以是终端设备的外部存储设备,例如,终端设备上配备的插接式硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,存储器还可以既包括终端设备的内部存储单元也包括外部存储设备。存储器用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,该其他程序如计算机程序的程序代码等。存储器还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质至少可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区,根据立法和专利实践,计算机可读介质不可以是电载波信号和电信信号。
本申请实现上述实施例方法中的全部或部分流程,也可以通过一种计算机程序产品来完成,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现可实现上述方法实施例中的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
Claims (9)
1.一种石英玻璃的检测方法,其特征在于,所述检测方法包括:
获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图;
对所述第一特征图进行权重计算,得到第一特征权重矩阵,对所述第二特征图进行权重计算,得到第二特征权重矩阵;
使用所述第一特征权重矩阵对所述第一特征图进行增强,得到第一增强特征图,使用所述第二特征权重矩阵对所述第二特征图进行增强,得到第二增强特征图,将所述第一增强特征图与所述第二增强特征图融合,得到第一融合特征图;
对所述第一融合特征图进行卷积,得到卷积特征图,从所述第一融合特征图中选取K个特征点,针对任一特征点,计算所述特征点与所述卷积特征图中每个像素点的差值,根据所述差值与预设缩放因子,计算所述卷积特征图相对于所述特征点的映射值,将所述映射值作为对应所述特征点的观测结果,K为大于1的整数;
根据所述第一融合特征图和所有特征点对应的观测结果,计算得到对应所述第一融合特征图的第三特征权重矩阵,根据所述第三特征权重矩阵对所述第一特征图与所述第二特征图进行增强,得到第三增强特征图与第四增强特征图;
将所述第三增强特征图与所述第四增强特征图进行下采样处理,得到下采样后的第三增强特征图与下采样后的第四增强特征图,将所述下采样后的第三增强特征图作为所述第一图像,将下采样后的第四增强特征图作为所述第二图像,返回执行对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图的步骤,直至迭代完成;
对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对所述第二融合特征图进行检测,得到检测结果。
2.如权利要求1所述的检测方法,其特征在于,所述对所述第一特征图进行权重计算,得到第一特征权重矩阵,对所述第二特征图进行权重计算,得到第二特征权重矩阵,包括:
对所述第一特征图进行全局平均池化处理,得到第一平均池化特征图,对所述第一平均池化特征图进行空间投影,得到第一投影特征图;
将所述第一特征图进行空间投影,得到第二投影特征图,计算所述第一投影特征图与所述第二投影特征图之间的全局关联性,得到第一关联度矩阵;
对所述第二特征图进行全局平均池化处理,得到第二平均池化特征图,对所述第二平均池化特征图进行空间投影,得到第三投影特征图;
将所述第二特征图进行空间投影,得到第四投影特征图,计算所述第三投影特征图与所述第四投影特征图之间的全局关联性,得到第二关联度矩阵;
对所述第一关联度矩阵激活处理,得到对应第一特征权重矩阵,对所述第二关联度矩阵进行激活处理,得到对应第二特征权重矩阵。
3.如权利要求1所述的检测方法,其特征在于,所述对所述第一融合特征图进行卷积,得到卷积特征图,包括:
对所述第一融合特征图进行卷积操作,得到初始卷积特征图;
对所述初始卷积特征图进行归一化处理,得到归一化特征图;
对所述归一化特征图进行激活处理,得到对应卷积特征图。
4.如权利要求1所述的检测方法,其特征在于,所述根据所述第一融合特征图和所有特征点对应的观测结果,计算得到对应所述第一融合特征图的第三特征权重矩阵,包括:
将所述所有特征点对应的观测结果进行批归一化处理,得到对应归一化观测结果;
将所述归一化观测结果进行激活处理,得到激活观测结果;
将所述激活观测结果进行全局平均池化,得到特征点特征图;
根据所述第一融合特征图和所述特征点特征图,计算得到对应所述第一融合特征图的第三特征权重矩阵。
5.如权利要求4所述的检测方法,其特征在于,所述根据所述第一融合特征图和所述特征点特征图,计算得到对应所述第一融合特征图的第三特征权重矩阵,包括:
对所述特征点特征图进行激活处理,得到特征权重矩阵;
使用所述特征权重矩阵对所述第一融合特征图进行增强,得到所述第一融合特征图的融合增强特征图;
对所述融合增强特征图进行激活处理,得到第三特征权重矩阵。
6.如权利要求1所述的检测方法,其特征在于,所述根据所述第三特征权重矩阵对所述第一特征图与所述第二特征图进行激活,得到第三增强特征图与第四增强特征图,包括:
使用所述第三特征权重矩阵对所述第一特征图进行增强,得到对应第三增强特征图;
根据预设阈值与所述第三特征权重矩阵,计算第四权重矩阵;
使用所述第四权重矩阵对所述第二特征图进行增强,得到对应第四增强特征图。
7.一种石英玻璃的检测装置,其特征在于,所述石英玻璃检测装置包括:
获取模块,用于获取待检测石英玻璃的表征光强特征的第一图像与表征偏振特征的第二图像,对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图;
权重计算模块,用于对所述第一特征图进行权重计算,得到第一特征权重矩阵,对所述第二特征图进行权重计算,得到第二特征权重矩阵;
增强模块,用于使用所述第一特征权重矩阵对所述第一特征图进行增强,得到第一增强特征图,使用所述第二特征权重矩阵对所述第二特征图进行增强,得到第二增强特征图,将所述第一增强特征图与所述第二增强特征图融合,得到第一融合特征图;
观测模块,用于对所述第一融合特征图进行卷积,得到卷积特征图,从所述第一融合特征图中选取K个特征点,针对任一特征点,计算所述特征点与所述卷积特征图中每个像素点的差值,根据所述差值与预设缩放因子,计算所述卷积特征图相对于所述特征点的映射值,将所述映射值作为对应所述特征点的观测结果,K为大于1的整数;
激活模块,用于根据所述第一融合特征图和所有特征点对应的观测结果,计算得到对应所述第一融合特征图的第三特征权重矩阵,根据所述第三特征权重矩阵对所述第一特征图与所述第二特征图进行激活,得到第三增强特征图与第四增强特征图;
迭代模块,用于将所述第三增强特征图与所述第四增强特征图进行下采样处理,得到下采样后的第三增强特征图与下采样后的第四增强特征图,将所述下采样后的第三增强特征图作为所述第一图像,将下采样后的第四增强特征图作为所述第二图像,返回执行对所述第一图像与所述第二图像分别进行特征提取,得到对应所述第一图像的第一特征图与对应所述第二图像的第二特征图的步骤,直至迭代完成;
融合模块,用于对每次迭代对应的第三增强特征图与第四增强特征图进行融合,得到第二融合特征图,对所述第二融合特征图进行检测,得到检测结果。
8.一种终端设备,其特征在于,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的检测方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310897131.3A CN116630310B (zh) | 2023-07-21 | 2023-07-21 | 一种石英玻璃的检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310897131.3A CN116630310B (zh) | 2023-07-21 | 2023-07-21 | 一种石英玻璃的检测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116630310A CN116630310A (zh) | 2023-08-22 |
CN116630310B true CN116630310B (zh) | 2023-11-17 |
Family
ID=87602875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310897131.3A Active CN116630310B (zh) | 2023-07-21 | 2023-07-21 | 一种石英玻璃的检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116630310B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204510A (zh) * | 2016-07-08 | 2016-12-07 | 中北大学 | 一种基于结构相似度约束的红外偏振与光强图像融合方法 |
WO2021071995A1 (en) * | 2019-10-07 | 2021-04-15 | Boston Polarimetrics, Inc. | Systems and methods for surface normals sensing with polarization |
CN115393233A (zh) * | 2022-07-25 | 2022-11-25 | 西北农林科技大学 | 一种基于自编码器的全线偏振图像融合方法 |
CN115861608A (zh) * | 2022-10-26 | 2023-03-28 | 中国人民解放军陆军工程大学 | 一种基于光强与偏振线索的伪装目标分割方法及系统 |
CN116205918A (zh) * | 2023-04-28 | 2023-06-02 | 锋睿领创(珠海)科技有限公司 | 基于图卷积的多模态融合半导体检测方法、装置及介质 |
CN116433661A (zh) * | 2023-06-12 | 2023-07-14 | 锋睿领创(珠海)科技有限公司 | 多任务学习的半导体晶圆检测方法、装置、设备及介质 |
-
2023
- 2023-07-21 CN CN202310897131.3A patent/CN116630310B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204510A (zh) * | 2016-07-08 | 2016-12-07 | 中北大学 | 一种基于结构相似度约束的红外偏振与光强图像融合方法 |
WO2021071995A1 (en) * | 2019-10-07 | 2021-04-15 | Boston Polarimetrics, Inc. | Systems and methods for surface normals sensing with polarization |
CN115393233A (zh) * | 2022-07-25 | 2022-11-25 | 西北农林科技大学 | 一种基于自编码器的全线偏振图像融合方法 |
CN115861608A (zh) * | 2022-10-26 | 2023-03-28 | 中国人民解放军陆军工程大学 | 一种基于光强与偏振线索的伪装目标分割方法及系统 |
CN116205918A (zh) * | 2023-04-28 | 2023-06-02 | 锋睿领创(珠海)科技有限公司 | 基于图卷积的多模态融合半导体检测方法、装置及介质 |
CN116433661A (zh) * | 2023-06-12 | 2023-07-14 | 锋睿领创(珠海)科技有限公司 | 多任务学习的半导体晶圆检测方法、装置、设备及介质 |
Non-Patent Citations (2)
Title |
---|
基于光强―光谱―偏振信息融合的水下目标检测;陈哲 等;通信学报(第03期);全文 * |
陈哲 等.基于光强―光谱―偏振信息融合的水下目标检测.通信学报.2013,(第03期),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN116630310A (zh) | 2023-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110084292B (zh) | 基于DenseNet和多尺度特征融合的目标检测方法 | |
CN108647585B (zh) | 一种基于多尺度循环注意力网络的交通标识符检测方法 | |
CN112132156B (zh) | 多深度特征融合的图像显著性目标检测方法及系统 | |
US20180101951A1 (en) | Method and system for processing image | |
KR102140805B1 (ko) | 위성 영상의 물체 식별을 위한 뉴럴 네트워크 학습 방법 및 장치 | |
CN111931931A (zh) | 一种针对病理全场图像的深度神经网络训练方法、装置 | |
CN115496976B (zh) | 多源异构数据融合的视觉处理方法、装置、设备及介质 | |
EP3872761A2 (en) | Analysing objects in a set of frames | |
CN109685830B (zh) | 目标跟踪方法、装置和设备及计算机存储介质 | |
CN115147598A (zh) | 目标检测分割方法、装置、智能终端及存储介质 | |
CN108154153B (zh) | 场景分析方法和系统、电子设备 | |
CN111179270A (zh) | 基于注意力机制的图像共分割方法和装置 | |
CN114445356A (zh) | 基于多分辨率的全视野病理切片图像肿瘤快速定位方法 | |
CN116205918B (zh) | 基于图卷积的多模态融合半导体检测方法、装置及介质 | |
Sun et al. | An image enhancement approach for coral reef fish detection in underwater videos | |
CN116433661B (zh) | 多任务学习的半导体晶圆检测方法、装置、设备及介质 | |
CN116311004B (zh) | 基于稀疏光流提取的视频运动目标检测方法 | |
CN116630310B (zh) | 一种石英玻璃的检测方法、装置、设备及介质 | |
CN117333440A (zh) | 输配电线路缺陷检测方法、装置、设备、介质和程序产品 | |
CN116543295A (zh) | 一种基于退化图像增强的轻量化水下目标检测方法及系统 | |
Liu et al. | Global-local attention mechanism based small object detection | |
CN113095185A (zh) | 人脸表情识别方法、装置、设备及存储介质 | |
CN113205131A (zh) | 图像数据的处理方法、装置、路侧设备和云控平台 | |
Yang et al. | Defect recognition of printed circuit board based on YOLOv3-DenseNet optimization model | |
Xu et al. | Vision-based underwater target real-time detection for autonomous underwater vehicle subsea exploration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |