CN114202492A - 基于三维卷积的非朗伯体表面光度立体模型及方法 - Google Patents
基于三维卷积的非朗伯体表面光度立体模型及方法 Download PDFInfo
- Publication number
- CN114202492A CN114202492A CN202111527424.XA CN202111527424A CN114202492A CN 114202492 A CN114202492 A CN 114202492A CN 202111527424 A CN202111527424 A CN 202111527424A CN 114202492 A CN114202492 A CN 114202492A
- Authority
- CN
- China
- Prior art keywords
- information
- layer
- input
- dimensional
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000000605 extraction Methods 0.000 claims abstract description 48
- 230000004927 fusion Effects 0.000 claims abstract description 33
- 238000011176 pooling Methods 0.000 claims abstract description 33
- 238000012545 processing Methods 0.000 claims abstract description 30
- 239000000284 extract Substances 0.000 claims abstract description 6
- 238000004364 calculation method Methods 0.000 claims abstract description 3
- 230000004913 activation Effects 0.000 claims description 50
- 230000006870 function Effects 0.000 claims description 44
- 239000013598 vector Substances 0.000 claims description 14
- 238000005286 illumination Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/95—Investigating the presence of flaws or contamination characterised by the material or shape of the object to be examined
- G01N21/9515—Objects of complex shape, e.g. examined with use of a surface follower device
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61K—AUXILIARY EQUIPMENT SPECIALLY ADAPTED FOR RAILWAYS, NOT OTHERWISE PROVIDED FOR
- B61K9/00—Railway vehicle profile gauges; Detecting or indicating overheating of components; Apparatus on locomotives or cars to indicate bad track sections; General design of track recording vehicles
- B61K9/08—Measuring installations for surveying permanent way
- B61K9/10—Measuring installations for surveying permanent way for detecting cracks in rails or welds thereof
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8806—Specially adapted optical and illumination features
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8851—Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/89—Investigating the presence of flaws or contamination in moving material, e.g. running paper or textiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
- G06T7/0008—Industrial image inspection checking presence/absence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/521—Depth or shape recovery from laser ranging, e.g. using interferometry; from the projection of structured light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8806—Specially adapted optical and illumination features
- G01N2021/8812—Diffuse illumination, e.g. "sky"
- G01N2021/8816—Diffuse illumination, e.g. "sky" by using multiple sources, e.g. LEDs
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8806—Specially adapted optical and illumination features
- G01N2021/8835—Adjustable illumination, e.g. software adjustable screen
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/8806—Specially adapted optical and illumination features
- G01N2021/8838—Stroboscopic illumination; synchronised illumination
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/84—Systems specially adapted for particular applications
- G01N21/88—Investigating the presence of flaws or contamination
- G01N21/89—Investigating the presence of flaws or contamination in moving material, e.g. running paper or textiles
- G01N21/8914—Investigating the presence of flaws or contamination in moving material, e.g. running paper or textiles characterised by the material examined
- G01N2021/8918—Metal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10028—Range image; Depth image; 3D point clouds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10141—Special mode during image acquisition
- G06T2207/10152—Varying illumination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30136—Metal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30164—Workpiece; Machine component
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Mechanical Engineering (AREA)
- Signal Processing (AREA)
- Textile Engineering (AREA)
- Quality & Reliability (AREA)
- Optics & Photonics (AREA)
- Length Measuring Devices By Optical Means (AREA)
- Image Analysis (AREA)
- Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)
Abstract
本发明属于图像处理技术领域,具体涉及基于三维卷积的非朗伯体表面光度立体模型及方法。本发明公开了基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层、帧间特征提取层、空间特征提取层、最大池化层和回归层;所述信息融合层用于融合每一张图像与其对应的光源信息,保证在后续处理中图像与光源的一一对应;所述帧间特征提取层用于提取帧间信息,获取输入图像帧之间的信息,用于我们法向图的估计;所述空间特征提取层提取单张图像内部的结构信息用于法向图的恢复;所述最大池化层用于用于降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减少计算量、减少内存消耗。
Description
技术领域
本发明属于图像处理技术领域,具体涉及基于三维卷积的非朗伯体表面光度立体模型及方法。
背景技术
近年来随着3D相关技术的发展,非刚性体的三维数字化技术受到了业内的广泛关注。实现高效、高精度、廉价的重建方法一直是三维数字化领域的一个研究重点。
现有的方法都是单独使用空间信息或者帧间信息来进行法向量的恢复。因此提出了一种多维度信息融合的方法,同时使用空间信息和帧间信息来进行法向量的求解,在算法对于异常值区域(高光和阴影)具有较好的鲁棒性的同时,又能保留丰富的纹理信息。
发明内容
本发明的第一个方面:旨在提供基于三维卷积获取非朗伯体表面三维图像的方法。
为实现上述技术目的,本发明采用的技术方案如下:
基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层、帧间特征提取层、空间特征提取层、最大池化层和回归层;
所述信息融合层用于融合每一张图像与其对应的光源信息,保证在后续处理中图像与光源的一一对应;
所述帧间特征提取层用于提取帧间信息,获取输入图像帧之间的信息,用于我们法向图的估计;
所述空间特征提取层提取单张图像内部的结构信息用于法向图的恢复;
所述最大池化层用于用于降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减少计算量、减少内存消耗。
作为本发明的一种优选方案,所述信息融合层包括一个三维卷积层C1,三维卷积层C1后跟有一个LeakyReLU激活函数,其LeakyReLU激活函数输出值dropout比率为0.2。
作为本发明的一种优选方案,所述帧间特征提取层包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,每个LeakyReLU激活函数输出值dropout比率为0.2。
作为本发明的一种优选方案,所述空间特征提取层包括三个三维卷积层,其分别为三维卷积层C5、三维卷积层6和三维卷积层C7,每个三维卷积层后跟有一个LeakyReLU激活函数。
作为本发明的一种优选方案,所述回归层包括三个二维卷积层,其分别为二维卷积层C8、二维卷积层C9和二维卷积层C10,二维卷积层C8和二维卷积层C9后跟有一个LeakyReLU激活函数,二维卷积层C10后跟有一个L2 normalization修正函数。
本发明的第二方面,提供一种以多张从不同角度照明的图像来重建待测工件三维表面信息的数据处理系统。
一种数据处理系统,包括数据处理器、图形处理器和数据存储器,数据处理器从数据存储器中读取图像并输入图形处理器中,图形处理器中预设图像识别网络,图像识别网络包括图像输入、获得输入图像的有效特征的特征提取器、最大池化层和法向求解单元;其特征在于:图像输入至初始融合模块,初始融合模块使当前图像及其光照信息一一对应,初始融合模块输出的融合了光照信息的图像输入到特征提起器中,特征提取器包括帧间信息提取器和空间信息提取器,帧间信息提取器和空间信息提取器均使用三维卷积核,其中帧间信息占一个维度,空间信息占两个维度;帧间信息提取器的输入是初始融合模块的输出,空间信息提取器的输入是帧间信息提取器的输出;空间信息提取器的输出作为最大池化层的输入。
进一步,法向求解单元对最大池化层的输出先做卷积操作,然后做L2正则化,正则化输出的结果为法向图。
进一步,法向求解单元的最后一个卷积操作使用3通道。
进一步,图像识别网络的其他卷积操作使用128通道。
进一步,融合待测物体图像的空间信息和帧间信息的步骤包括:
其中,ILinput表示公式的输入,ILinput包括每次拍摄任务获得的各张图像和光源强度、以及光源方向,F0表示公式的输出,Con6×1×1表示一个尺寸为6×1×1的卷积核,Con6×1×1(ILinput)表示对ILinput做卷积操作,σ表示leaky Relu激活函数,σ(Con6×1×1(ILinput)表示对Con6×1×1(ILinput)做激活操作。表示dropout操作,表示对σ(Con6×1×1(ILinput)做dropout操作。卷积操作、激活操作和dropout操作属于深度学习的常规函数或常规操作。
每张图像具有R、G、B三个通道,每张图像拍摄时的光源信息图需要X、Y、Z三个坐标值来表征,每个坐标方向的值存储在一个通道里;将每张图像的3通道信息和对应的光源信息图的3通道信息、这6个通道的信息通过一个6×1×1的卷积核进行操作,由此融合该张图像与对应光源信息,防止之后的操作将一一对应的关系打乱。
可选的,使用IRFE(帧间信息提取器)进行帧间信息提取,
IRFE由一个尺寸为5×1×1的卷积核,一个leaky Relu激活函数和一个dropout层组成:·表示帧间信息提取器的输入,表示对输入进行i次卷积,卷积核的尺寸为5×1×1;表示对进行激活操作,表示对进行dropout操作。
进一步,使用IRFE提取帧间信息提取的步骤为:
将IRFE的初始输入·设置为F0,
其中,F0表示信息融合模块公式的输出;表示第一个帧间信息提取器的输出,IRFE1(F0)表示第一个帧间信息提取器以F0作为输入;K为IRFE的个数,表示第K个帧间信息提取器的输出,表示第K个帧间信息提取器以第K-1个帧间信息提取器的输出作为输入;
优选的,K=3。
进一步,使用IAFE(空间信息提取器)进行空间信息提取,IAFE由一个尺寸为1×3×3的卷积核,一个leaky Relu激活函数组成: 其中,·表示空间信息提取器的输入,表示对输入做i次卷积、卷积核的尺寸为1×3×3,表示对进行激活。
优选的,L=3。
,MP表示最大池化max-pooling操作,FMAX表示最大池化的输出。这一步的操作提取不同通道之间最显著的信息,同时也为后面的操作固定了输入通道。
进一步,以FMAX作为输入进行法向量求解:
以Nij表示像素坐标为(i,j)的点的法向量,以整个图像的所有像素的法向量形成的法向图表征待测物体的表面三维信息。
本发明的有益效果:
本发明将三维卷积引入光度立体领域,提出了MT-CNN-PS模型;该模型充分利用了输入图像序列的帧间信息与空间信息,具有较好的法向量恢复准确率;空间信息对于高光点,以及阴影区域具有很好的信息补偿作用,加入空间信息可以提高算法对于异常区域的鲁棒性;
本发明在训练时加入了光源图像掩膜,用于减小无用点对于结果的干扰;提高了模型对于图像阴影部分的鲁棒性;本发明的模型在保留高运算速度的同时,相比于现有的光度立体方法具有较高的法向恢复准确率,具有较好的工业运用前景。
附图说明
本发明可以通过附图给出的非限定性实施例进一步说明。
图1是本发明基于三维卷积的非朗伯体表面光度立体模型的网络结构示意图。
图2是本发明基于三维卷积的非朗伯体表面光度立体方法的流程示意图。
图3是本发明实施例1~5的网络结构示意图。
图4是本发明实施例6的网络结构示意图。
图5是本发明实施例7的网络结构示意图。
图6是本发明实施例8的网络结构示意图。
图7是基于MERL数据集渲染图像结果对比结果。
具体实施方式
为了使本领域的技术人员可以更好地理解本发明,下面结合附图和实施例对本发明技术方案进一步说明。
如图1所示,本发明公开了基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层1、帧间特征提取层2、空间特征提取层3、最大池化层4和回归层5;
信息融合层1用于融合每一张图像与其对应的光源信息,保证在后续处理中图像与光源的一一对应;
帧间特征提取层2用于提取帧间信息,获取输入图像帧之间的信息,用于我们法向图的估计;
空间特征提取层3提取单张图像内部的结构信息用于法向图的恢复;
最大池化层4用于用于降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减少计算量、减少内存消耗。
信息融合层1包括一个三维卷积层C1,三维卷积层C1后跟有一个LeakyReLU激活函数,其LeakyReLU激活函数输出值dropout比率为0.2。
帧间特征提取层2包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,每个LeakyReLU激活函数输出值dropout比率为0.2。
空间特征提取层3包括三个三维卷积层,其分别为三维卷积层C5、三维卷积层6和三维卷积层C7,每个三维卷积层后跟有一个LeakyReLU激活函数。
回归层5包括三个二维卷积层,其分别为二维卷积层C8、二维卷积层C9和二维卷积层C10,二维卷积层C8和二维卷积层C9后跟有一个LeakyReLU激活函数,二维卷积层C10后跟有一个L2 normalization修正函数。
在一些实施例中,一种数据处理系统,包括数据处理器、图形处理器和数据存储器,数据处理器从数据存储器中读取图像并输入图形处理器中,图形处理器中预设图像识别网络,图像识别网络为基于三维卷积的非朗伯体表面光度立体模型,如图1、2所示,图像识别网络包括图像输入、获得输入图像的有效特征的特征提取器、最大池化层和法向求解单元;图像输入至初始融合模块,初始融合模块使当前图像及其光照信息一一对应,初始融合模块输出的融合了光照信息的图像输入到特征提起器中,特征提取器包括帧间信息提取器和空间信息提取器,帧间信息提取器和空间信息提取器均使用三维卷积核,其中帧间信息占一个维度,空间信息占两个维度;帧间信息提取器的输入是初始融合模块的输出,空间信息提取器的输入是帧间信息提取器的输出;空间信息提取器的输出作为最大池化层的输入。
在一些实施例中,法向求解单元对最大池化层的输出先做卷积操作,然后做L2正则化,正则化输出的结果为法向图。在一些实施例中,法向求解单元的最后一个卷积操作使用3通道。在一些实施例中,图像识别网络的其他卷积操作使用128通道。上述回归层作为法向量求解单元。
如图1、2所示,在一些实施例中,提取待测物体图像中的空间信息和帧间信息,空间信息和帧间信息均以三维卷积分别表示,其中,三维卷积包括二维空间维度和一维帧间维度,空间信息的三维卷积中的一维帧间维度的值为设定值、二维空间维度为图像的空间信息值,帧间信息的三维卷积中的二维空间维度的值为设定值,一维帧间维度为帧间信息值;进行图像信息融合时,先处理帧间信息,再处理空间信息,再融合帧间信息和空间信息获得待测物体表面纹理的三维图像。
在一些实施例中,融合待测物体图像的空间信息和帧间信息的步骤包括:
其中,ILinput表示公式的输入,ILinput包括每次拍摄任务获得的各张图像和光源强度、以及光源方向,F0表示公式的输出,Con6×1×1表示一个尺寸为6×1×1的卷积核,Con6×1×1(ILinput)表示对ILinput做卷积操作,σ表示leaky Relu激活函数,σ(Con6×1×1(ILinput)表示对Con6×1×1(ILinput)做激活操作。表示dropout操作,表示对σ(Con6×1×1(ILinput)做dropout操作。卷积操作、激活操作和dropout操作属于深度学习的常规函数或常规操作。
每张图像具有R、G、B三个通道,每张图像拍摄时的光源信息图需要X、Y、Z三个坐标值来表征,每个坐标方向的值存储在一个通道里;将每张图像的3通道信息和对应的光源信息图的3通道信息、这6个通道的信息通过一个6×1×1的卷积核进行操作,由此融合该张图像与对应光源信息,防止之后的操作将一一对应的关系打乱。
在一些实施例中,使用IRFE(帧间信息提取器)进行帧间信息提取,IRFE由一个尺寸为5×1×1的卷积核,一个leaky Relu激活函数和一个dropout层组成:·表示帧间信息提取器的输入,表示对输入进行i次卷积,卷积核的尺寸为5×1×1;表示对进行激活操作,表示对进行dropout操作。
在一些实施例中,使用IRFE提取帧间信息提取的步骤为:
将IRFE的初始输入·设置为F0,
其中,F0表示信息融合模块公式的输出;表示第一个帧间信息提取器的输出,IRFE1(F0)表示第一个帧间信息提取器以F0作为输入;K为IRFE的个数,表示第K个帧间信息提取器的输出,表示第K个帧间信息提取器以第K-1个帧间信息提取器的输出作为输入。本实施例中,K=3。
在一些实施例中,使用IAFE(空间信息提取器)进行空间信息提取,IAFE由一个尺寸为1×3×3的卷积核,一个leaky Relu激活函数组成:其中,·表示空间信息提取器的输入,表示对输入做i次卷积、卷积核的尺寸为1×3×3,表示对进行激活。
,MP表示最大池化max-pooling操作,FMAX表示最大池化的输出。这一步的操作提取不同通道之间最显著的信息,同时也为后面的操作固定了输入通道。
进一步,以FMAX作为输入进行法向量求解:
其中,Con1×1表示尺寸为1×1的卷积,Con1×1(FMAX)表示对FMAX进行卷积操作,卷积核的尺寸为1×1,σ表示leaky Relu激活函数,表示L2正则化;以Nij表示像素坐标为(i,j)的点的法向量,以整个图像的所有像素的法向量形成的法向图表征待测物体的表面三维信息。
具体的实施例1~5,
如图3所示,基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层、帧间特征提取层、空间特征提取层、最大池化层和回归层;
帧间特征提取层包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,每个LeakyReLU激活函数输出值dropout比率为0.2,三维卷积层C2、三维卷积层C3和三维卷积层C4包括IF个1*1的特征图;
空间特征提取层包括三个三维卷积层,其分别为三维卷积层C5、三维卷积层6和三维卷积层C7,每个三维卷积层后跟有一个LeakyReLU激活函数;三维卷积层C5、三维卷积层6和三维卷积层C7包括1个S*S的特征图;
在图像处理过程中,先进行帧间特征提取层处理,再进行帧间特征提取层处理;
其中,实施例1取:S=3,IF=5;
实施例2取:S=1,IF=5;
实施例3取:S=5,IF=5;
实施例4取:S=3,IF=1;
实施例5取:S=3,IF=3;
实施例6
如图4所示,基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层、帧间特征提取层、空间特征提取层、最大池化层和回归层;
帧间特征提取层包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,每个LeakyReLU激活函数输出值dropout比率为0.2,三维卷积层C2、三维卷积层C3和三维卷积层C4包括1个3*3的特征图;
空间特征提取层包括三个三维卷积层,其分别为三维卷积层C5、三维卷积层6和三维卷积层C7,每个三维卷积层后跟有一个LeakyReLU激活函数;三维卷积层C5、三维卷积层6和三维卷积层C7包括5个1*1的特征图;
在图像处理过程中,先进行帧间特征提取层处理,再进行帧间特征提取层处理;
实施例7
如图5所示,基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层、帧间特征提取层、空间特征提取层、最大池化层和回归层;
帧间特征提取层包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,三维卷积层C2、三维卷积层C3和三维卷积层C4包括IF个1*1的特征图;
空间特征提取层包括三个三维卷积层,其分别为三维卷积层C5、三维卷积层6和三维卷积层C7,每个三维卷积层后跟有一个LeakyReLU激活函数;三维卷积层C5、三维卷积层6和三维卷积层C7包括1个S*S的特征图;
在图像处理过程中,先进行帧间特征提取层处理,再进行帧间特征提取层处理;
其中,S=3,IF=5;
实施例8
如图6所示,基于三维卷积的非朗伯体表面光度立体模型,包括信息融合层、特征提取层、最大池化层和回归层;
特征提取层包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,每个LeakyReLU激活函数输出值dropout比率为0.2,三维卷积层C2、三维卷积层C3和三维卷积层C4包括5个3*3的特征图;
将实施例1~8卷积数据分析结果,针对不同形状的图像进行测试,其MAE值如表1所示,
表1
由表1可知,参考各个实施例的MAE值,其实施例1的对于每一种图形下的效果相对较好;且相对稳定;
按照实施例1的卷积层数据,建立MT-CNN-PS模型,将此模型与其它模型进行对比,针对不同形状的图像进行测试,其MAE值如表2所示;
表2
由表2可知,通过MT-CNN-PS模型处理的图像,对于不同形状下的效果每一明显的劣势,且在公开数据集DiLiGenT中熊、佛样本上上有明显的优势,因此其处理后的图像有较高的准确率。
按照实施例1的卷积层数据,建立MT-CNN-PS模型,将此模型的光度立体方法与其它光度立体方法在输入图片数量较少时的平均误差对比(DiLiGenT十个物体平均误差),其MAE值如表3所示,
96 | 16 | 10 | 8 | 6 | |
本模型 | 7.56 | 8.82 | 9.84 | 10.75 | 12.30 |
JU-19 | 8.43 | 9.66 | 10.02 | 10.39 | 12.16 |
CH-18 | 8.39 | 9.37 | 10.33 | 11.13 | 12.56 |
SI-18 | 7.20 | 10.49 | 14.34 | 19.50 | 30.28 |
IK-12 | 14.08 | 15.47 | 16.37 | 16.84 | 18.45 |
BASELINE | 15.39 | 16.65 | 17.31 | 17.47 | 18.60 |
表3
·表第一行代表输入的图像,第一列代表方法名称,中间数值代表平均角度误差。
·该表是本模型与目前先进的稀疏输入光度立体方法的横向对比,其中
JU-19,CH-18,SI-18都是基于深度学习的方法且JU-19,CH-18有特定的结构来针对稀疏输入的问题,甚于方法都是传统方法。可以看出我们的模型没有复杂的针对稀疏输入的结构,只是用了帧间空间提取器来提高信息利用率就能在16张和10张图片输入的时候有较好的效果。
按照实施例1的卷积层数据,建立MT-CNN-PS模型,将此模型的光度立体方法与其它光度立体方法在输入图片数量较少时的平均误差对比(DiLiGenT十个物体具体误差),其MAE值如表3所示,
表4
由表3和表4可知,相对于其他的光度立体方法,MT-CNN-PS模型具有相对较好图像处理的稳定性。
将实施例1的卷积层数据,建立MT-CNN-PS模型,将此模型光度立体方法处理后的图像,和PS-FCN模型立体方法处理后的图像,基于MERL数据集渲染图像结果对比结果如图7所示,
由图7可知,相对于PS-FCN来说,MT-CNN-PS模型具有相对较好图像处理的稳定性,并且其精确度更好。
综上所述,本发明具有较好的法向量恢复准确率;空间信息对于高光点,以及阴影区域具有很好的信息补偿作用,加入空间信息可以提高算法对于异常区域的鲁棒性;本发明的模型在保留高运算速度的同时,相比于现有的光度立体方法具有较高的法向恢复准确率,具有较好的工业运用前景。
上述实施例仅示例性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (14)
1.基于三维卷积的非朗伯体表面光度立体模型,其特征在于:包括信息融合层、帧间特征提取层、空间特征提取层、最大池化层和回归层;
所述信息融合层用于融合每一张图像与其对应的光源信息,保证在后续处理中图像与光源的一一对应;
所述帧间特征提取层用于提取帧间信息,获取输入图像帧之间的信息,用于我们法向图的估计;
所述空间特征提取层提取单张图像内部的结构信息用于法向图的恢复;
所述最大池化层用于用于降维、去除冗余信息、对特征进行压缩、简化网络复杂度、减少计算量、减少内存消耗。
2.根据权利要求1所述的基于三维卷积的非朗伯体表面光度立体模型,其特征在于:所述信息融合层包括一个三维卷积层C1,三维卷积层C1后跟有一个LeakyReLU激活函数,其LeakyReLU激活函数输出值dropout比率为0.2。
3.根据权利要求1所述的基于三维卷积的非朗伯体表面光度立体模型,其特征在于:所述帧间特征提取层包括三个三维卷积层,其分别为三维卷积层C2、三维卷积层C3和三维卷积层C4,每个三维卷积层后跟有一个LeakyReLU激活函数,每个LeakyReLU激活函数输出值dropout比率为0.2。
4.根据权利要求1所述的基于三维卷积的非朗伯体表面光度立体模型,其特征在于:所述空间特征提取层包括三个三维卷积层,其分别为三维卷积层C5、三维卷积层6和三维卷积层C7,每个三维卷积层后跟有一个LeakyReLU激活函数。
5.根据权利要求1所述的基于三维卷积的非朗伯体表面光度立体模型,其特征在于:所述回归层包括三个二维卷积层,其分别为二维卷积层C8、二维卷积层C9和二维卷积层C10,二维卷积层C8和二维卷积层C9后跟有一个LeakyReLU激活函数,二维卷积层C10后跟有一个L2 normalization修正函数。
6.一种数据处理系统,包括数据处理器、图形处理器和数据存储器,数据处理器从数据存储器中读取图像并输入图形处理器中,图形处理器中预设图像识别网络,图像识别网络包括图像输入、获得输入图像的有效特征的特征提取器、最大池化层和法向求解单元;其特征在于:图像输入至初始融合模块,初始融合模块使当前图像及其光照信息一一对应,初始融合模块输出的融合了光照信息的图像输入到特征提起器中,特征提取器包括帧间信息提取器和空间信息提取器,帧间信息提取器和空间信息提取器均使用三维卷积核,其中帧间信息占一个维度,空间信息占两个维度;帧间信息提取器的输入是初始融合模块的输出,空间信息提取器的输入是帧间信息提取器的输出;空间信息提取器的输出作为最大池化层的输入。
7.如权利要求6所述的数据处理系统,其特征在于:法向求解单元对最大池化层的输出先做卷积操作,然后做L2正则化,正则化输出的结果为法向图。
8.如权利要求7所述的数据处理系统,其特征在于:法向求解单元的最后一个卷积操作使用3通道。
9.如权利要求8所述的数据处理系统,其特征在于:图像识别网络的其他卷积操作使用128通道。
10.如权利要求9所述的数据处理系统,其特征在于:融合待测物体图像的空间信息和帧间信息的步骤包括:
13.其中,F0表示信息融合模块公式的输出;表示第一个帧间信息提取器的输出,IRFE1(F0)表示第一个帧间信息提取器以F0作为输入;K为IRFE的个数,表示第K个帧间信息提取器的输出,表示第K个帧间信息提取器以第K-1个帧间信息提取器的输出作为输入;K=3;
和、或使用IAFE(空间信息提取器)进行空间信息提取,IAFE由一个尺寸为1×3×3的卷积核,一个leaky Relu激活函数组成:其中,·表示空间信息提取器的输入,表示对输入做i次卷积、卷积核的尺寸为1×3×3,表示对进行激活;
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011490539 | 2020-12-16 | ||
CN2020114905391 | 2020-12-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114202492A true CN114202492A (zh) | 2022-03-18 |
Family
ID=80653566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111527424.XA Pending CN114202492A (zh) | 2020-12-16 | 2021-12-14 | 基于三维卷积的非朗伯体表面光度立体模型及方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4016058B1 (zh) |
JP (1) | JP2022126587A (zh) |
CN (1) | CN114202492A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115656189A (zh) * | 2022-12-12 | 2023-01-31 | 易斯德(福建)智能科技有限公司 | 基于光度立体与深度学习算法的缺陷检测方法及装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116433701B (zh) * | 2023-06-15 | 2023-10-10 | 武汉中观自动化科技有限公司 | 一种工件孔洞轮廓的提取方法、装置、设备及存储介质 |
CN116577342B (zh) * | 2023-07-07 | 2023-10-31 | 杭州鄂达精密机电科技有限公司 | 一种工件视觉全检机系统 |
CN117422763B (zh) * | 2023-12-19 | 2024-05-31 | 商飞智能技术有限公司 | 一种模具表面打磨区域定位及打磨轨迹规划方法、装置 |
CN117830316B (zh) * | 2024-03-05 | 2024-05-07 | 深圳市远望工业自动化设备有限公司 | 汽车油箱表面焊接缺陷检测方法及相关装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5365084A (en) * | 1991-02-20 | 1994-11-15 | Pressco Technology, Inc. | Video inspection system employing multiple spectrum LED illumination |
WO2006128317A1 (de) * | 2005-06-03 | 2006-12-07 | Elpatronic Ag | Verfahren zur beleuchtung und beleuchtungsanordnung |
CN102507587B (zh) * | 2011-09-20 | 2013-11-27 | 株洲时代电子技术有限公司 | 巡视检测系统及方法 |
CN104778749B (zh) * | 2015-04-07 | 2017-06-23 | 浙江大学 | 基于分组稀疏的光度立体视觉实现非朗伯物体重建的方法 |
CN111122598B (zh) * | 2019-12-16 | 2022-12-09 | 北京冶自欧博科技发展有限公司 | 一种钢轨表面缺陷三维检测系统及方法 |
CN110919500A (zh) * | 2019-12-20 | 2020-03-27 | 温州金石机器人科技有限公司 | 一种轨道打磨加工流水线 |
-
2021
- 2021-12-14 EP EP21214212.9A patent/EP4016058B1/en active Active
- 2021-12-14 CN CN202111527424.XA patent/CN114202492A/zh active Pending
- 2021-12-16 JP JP2021204552A patent/JP2022126587A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115656189A (zh) * | 2022-12-12 | 2023-01-31 | 易斯德(福建)智能科技有限公司 | 基于光度立体与深度学习算法的缺陷检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2022126587A (ja) | 2022-08-30 |
EP4016058A1 (en) | 2022-06-22 |
EP4016058B1 (en) | 2023-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114202492A (zh) | 基于三维卷积的非朗伯体表面光度立体模型及方法 | |
WO2020108358A1 (zh) | 图像修复方法、装置、计算机设备和存储介质 | |
CN112232391B (zh) | 一种基于U-net网络和SC-SAM注意力机制的大坝裂缝检测方法 | |
CN107705306B (zh) | 一种基于多特征矩阵低秩分解的织物疵点检测方法 | |
CN111127631B (zh) | 基于单图像的三维形状和纹理重建方法、系统及存储介质 | |
CN110223370B (zh) | 一种从单视点图片生成完整人体纹理贴图的方法 | |
CN111414923A (zh) | 基于单幅rgb图像的室内场景三维重建方法及系统 | |
WO2011131029A1 (zh) | 一种基于轮廓带图的相似单元的检测方法 | |
CN112232134A (zh) | 一种基于沙漏网络结合注意力机制的人体姿态估计方法 | |
CN116310095A (zh) | 一种基于深度学习的多视图三维重建方法 | |
CN113689517A (zh) | 一种多尺度通道注意力网络的图像纹理合成方法及系统 | |
CN113570658A (zh) | 基于深度卷积网络的单目视频深度估计方法 | |
CN110517348B (zh) | 基于图像前景分割的目标物体三维点云重建方法 | |
CN113160078B (zh) | 雨天交通车辆图像去雨方法、装置、设备及可读存储介质 | |
CN111275610B (zh) | 一种人脸变老图像处理方法及系统 | |
CN117575931A (zh) | 一种超高清可见光与红外图像的匹配融合方法及装置 | |
CN116228986A (zh) | 一种基于局部到全局补全策略的室内场景光照估计方法 | |
CN114913287B (zh) | 一种三维人体模型重建方法及系统 | |
CN113239867B (zh) | 一种基于掩码区域自适应增强的光照变化人脸识别方法 | |
CN116188352A (zh) | 一种基于增强边缘特征的肺结节分割方法 | |
CN110853040B (zh) | 一种基于超分辨率重建的图像协同分割方法 | |
CN108961384A (zh) | 三维图像重建方法 | |
Wang et al. | Image inpainting based on structural tensor edge intensity model | |
CN113222879A (zh) | 一种用于红外与可见光图像融合的生成对抗网络 | |
CN111435448B (zh) | 图像显著性物体检测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |