CN113723515B - 基于图像识别的摩尔纹识别方法、装置、设备及介质 - Google Patents
基于图像识别的摩尔纹识别方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN113723515B CN113723515B CN202111012740.3A CN202111012740A CN113723515B CN 113723515 B CN113723515 B CN 113723515B CN 202111012740 A CN202111012740 A CN 202111012740A CN 113723515 B CN113723515 B CN 113723515B
- Authority
- CN
- China
- Prior art keywords
- network structure
- output
- branches
- result
- branch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012567 pattern recognition method Methods 0.000 title claims abstract description 9
- 230000009466 transformation Effects 0.000 claims abstract description 49
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000003909 pattern recognition Methods 0.000 claims abstract description 39
- 230000008447 perception Effects 0.000 claims abstract description 26
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000012549 training Methods 0.000 claims description 109
- 238000012545 processing Methods 0.000 claims description 49
- 239000011159 matrix material Substances 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 15
- 238000002372 labelling Methods 0.000 claims description 15
- 230000004913 activation Effects 0.000 claims description 12
- 230000007246 mechanism Effects 0.000 claims description 10
- 238000010586 diagram Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 230000008014 freezing Effects 0.000 claims description 4
- 238000007710 freezing Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 17
- 238000013473 artificial intelligence Methods 0.000 abstract description 12
- 238000005516 engineering process Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000004804 winding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及人工智能领域,提供一种基于图像识别的摩尔纹识别方法、装置、设备及介质,能够基于小波变换及模式感知记忆构建初始网络结构,并利用内卷算子优化得到第一中间网络结构,加速模型的收敛过程,并减少模型的参数,防止产生过拟合风险,并训练得到中间模型,利用预设网络层替换中间模型中的指定结构,并训练得到摩尔纹识别模型,在具有去除摩尔纹作用的模型的基础上进行学习训练,保留了模型的原有信息,使摩尔纹识别模型的识别效果更好,进而结合人工智能手段自动检测图像中是否含有摩尔纹。此外,本发明还涉及区块链技术,所述摩尔纹识别模型可存储于区块链节点中。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于图像识别的摩尔纹识别方法、装置、设备及介质。
背景技术
随着人工智能技术的发展,很多领域都涉及到对图像的处理,尤其是在各种风险控制场景下,图像是否带有摩尔纹,图像是否带有雨点等情况,都会影响对于图像的识别效果,进而影响风险识别等任务的执行。因此,如何自动识别到包含摩尔纹、雨点等质量问题的图像,在人工智能领域十分重要。
现有技术中,通常采用支持向量机(support vector machines,SVM)等模型进行简单的分类,识别的准确率还有待进一步提高。
发明内容
本发明实施例提供了一种基于图像识别的摩尔纹识别方法、装置、设备及介质,旨在解决摩尔纹识别准确率不高的问题。
第一方面,本发明实施例提供了一种基于图像识别的摩尔纹识别方法,其包括:
基于小波变换及模式感知记忆构建初始网络结构;
利用内卷算子优化所述初始网络结构,得到第一中间网络结构;
获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集;
利用所述第一训练集训练所述第一中间网络结构,得到中间模型;
利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构;
获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集;
利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型;
获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果。
根据本发明优选实施例,所述基于小波变换及模式感知记忆构建初始网络结构包括:
构建具有模式特征感知机制的密集分支,及构建膨胀分支;
根据所述密集分支及所述膨胀分支构建配置数量的子分支,其中,每个子分支包括一个所述密集分支及一个所述膨胀分支;在每个子分支中,所述密集分支的输出与配置参数相乘,得到第一输出,并计算所述第一输出与所述膨胀分支的输出的和,得到每个子分支的输出;所述配置数量的子分支的首尾依次相连,上一个子分支的输出作为下一个子分支的输入;
构建小波变换分支及小波逆变换分支;
结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支,得到所述初始网络结构。
根据本发明优选实施例,在结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支时,所述方法还包括:
在所述初始网络结构中,将所述小波变换分支的输出确定为第一特征图;
对所述第一特征图进行卷积操作,得到第二特征图;
将所述第二特征图输入至所述配置数量的子分支,得到第二输出;
计算所述第二输出与所述第二特征图的和,得到第三特征图;
对所述第三特征图进行卷积操作,得到第四特征图;
将所述第四特征图输入至所述小波逆变换分支进行小波逆变换处理,得到所述初始网络结构的输出。
根据本发明优选实施例,所述构建具有模式特征感知机制的密集分支,及构建膨胀分支包括:
构建方向空间感知结构;
将原始特征输入至所述方向空间感知结构,并对所述方向空间感知结构的输出进行卷积操作,得到第一结果;
将所述第一结果与第一残差密集块的输出及所述配置参数进行相乘,得到第二结果;
将所述原始特征与所述第二结果的和确定为第三结果;
将所述第三结果输入至第二残差密集块进行处理,得到第四结果;
计算所述第一结果与所述第四结果及所述配置参数的乘积,得到第五结果;
将所述第五结果与所述第三结果的和确定为所述密集分支的输出;
将所述原始特征输入至3*3膨胀卷积,得到第六结果;
利用3*3卷积对所述第六结果进行卷积操作,得到第七结果;
计算所述第六结果与所述第七结果的和,得到所述膨胀分支的输出。
根据本发明优选实施例,在构建方向空间感知结构后,所述方法还包括:
在所述方向空间感知结构中,对所述原始特征进行卷积操作,得到卷积结果;
对所述卷积结果进行两级卷积操作;
对所述两级卷积后得到的特征进行通道与空间注意力处理,得到权重图;
对所述卷积结果进行预设的多个方向的滑窗移动操作,得到每个方向上的第一特征;
基于所述多个方向拆分所述权重图,得到与每个方向对应的子权重图;
分别将每个方向上的第一特征与对应的子权重图进行点乘,并拼接点乘后得到的特征,得到拼接特征;
对所述拼接特征进行卷积操作,得到卷积特征;
对所述卷积特征进行所述多个方向的滑窗移动操作,得到每个方向上的第二特征;
分别将每个方向上的第二特征与对应的子权重图进行点乘;
拼接点乘后得到的特征,得到所述方向空间感知结构的输出。
根据本发明优选实施例,所述利用内卷算子优化所述初始网络结构,得到第一中间网络结构包括:
将所述初始网络结构的输入进行通道到空间的转换,得到所述初始网络结构的输入中每个点的内卷核;
获取所述初始网络结构的输入中每个点的邻域特征;
计算每个点的邻域特征与对应的内卷核的内积,得到每个点的矩阵特征;
计算每个点的矩阵特征在预设的第一维度上所有数值的和,并计算每个点的矩阵特征在预设的第二维度上所有数值的和,并作为所述初始网络结构的输出。
根据本发明优选实施例,所述预设网络层包括全连接层及激活函数层,所述指定结构包括所述小波逆变换分支;所述利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型包括:
将所述第二训练集输入至所述第二中间网络结构进行训练;
在训练过程中,冻结所述第二中间网络结构中除所述预设网络层外其他结构的参数;
实时检测所述第二中间网络结构的损失;
当所述第二中间网络结构的损失达到收敛时,停止训练,得到所述摩尔纹识别模型。
第二方面,本发明实施例提供了一种基于图像识别的摩尔纹识别装置,其包括:
构建单元,用于基于小波变换及模式感知记忆构建初始网络结构;
优化单元,用于利用内卷算子优化所述初始网络结构,得到第一中间网络结构;
处理单元,用于获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集;
训练单元,用于利用所述第一训练集训练所述第一中间网络结构,得到中间模型;
替换单元,用于利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构;
所述处理单元,还用于获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集;
所述训练单元,还用于利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型;
识别单元,用于获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于图像识别的摩尔纹识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于图像识别的摩尔纹识别方法。
本发明实施例提供了一种基于图像识别的摩尔纹识别方法、装置、设备及介质,能够基于小波变换及模式感知记忆构建初始网络结构,利用内卷算子优化所述初始网络结构,得到第一中间网络结构,加速模型的收敛过程,并减少模型的参数,防止产生过拟合风险,获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集,利用所述第一训练集训练所述第一中间网络结构,得到中间模型,利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构,获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集,利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型,获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果,进而结合人工智能手段自动检测图像中是否含有摩尔纹,在具有去除摩尔纹作用的模型的基础上进行学习训练,保留了模型的原有信息,能够使后续训练的所述摩尔纹识别模型的识别效果更好,进而提高了摩尔纹识别的准确率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于图像识别的摩尔纹识别方法的流程示意图;
图2为本发明实施例提供的基于图像识别的摩尔纹识别装置的示意性框图;
图3为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,为本发明实施例提供的基于图像识别的摩尔纹识别方法的流程示意图。
S10,基于小波变换及模式感知记忆构建初始网络结构。
在本发明的至少一个实施例中,所述基于小波变换及模式感知记忆构建初始网络结构包括:
构建具有模式特征感知机制的密集分支,及构建膨胀分支;
根据所述密集分支及所述膨胀分支构建配置数量的子分支,其中,每个子分支包括一个所述密集分支及一个所述膨胀分支;在每个子分支中,所述密集分支的输出与配置参数相乘,得到第一输出,并计算所述第一输出与所述膨胀分支的输出的和,得到每个子分支的输出;所述配置数量的子分支的首尾依次相连,上一个子分支的输出作为下一个子分支的输入;
构建小波变换分支及小波逆变换分支;
结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支,得到所述初始网络结构。
在本实施例中,所述配置数量的子分支可以配置为6个。
在本实施例中,所述配置参数是一种超参数,所述配置参数是根据试验不断调优确定的。
在本实施例中,所述卷积操作可以为经过1*1的卷积的操作。
具体地,在结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支时,所述方法还包括:
在所述初始网络结构中,将所述小波变换分支的输出确定为第一特征图;
对所述第一特征图进行卷积操作,得到第二特征图;
将所述第二特征图输入至所述配置数量的子分支,得到第二输出;
计算所述第二输出与所述第二特征图的和,得到第三特征图;
对所述第三特征图进行卷积操作,得到第四特征图;
将所述第四特征图输入至所述小波逆变换分支进行小波逆变换处理,得到所述初始网络结构的输出。
例如:所述初始网络结构的输出可以为(H/4)*(W/4)*48尺寸的图。
其中,H表示高,W表示宽,能够实现对原始的输入图像的缩放。
在上述实施方式中,结合所述初始网络结构的构成方式,即可确定数据在所述初始网络结构中的流转方式。
在本实施例中,通过两级小波变换(即所述小波变换分支及所述小波逆变换分支),同时结合所述密集分支及所述膨胀分支,得到的所述初始网络结构能够实现对摩尔纹图像中摩尔纹的去除。
具体地,所述构建具有模式特征感知机制的密集分支,及构建膨胀分支包括:
构建方向空间感知结构;
将原始特征输入至所述方向空间感知结构,并对所述方向空间感知结构的输出进行卷积操作,得到第一结果;
将所述第一结果与第一残差密集块的输出及所述配置参数进行相乘,得到第二结果;
将所述原始特征与所述第二结果的和确定为第三结果;
将所述第三结果输入至第二残差密集块进行处理,得到第四结果;
计算所述第一结果与所述第四结果及所述配置参数的乘积,得到第五结果;
将所述第五结果与所述第三结果的和确定为所述密集分支的输出;
将所述原始特征输入至3*3膨胀卷积,得到第六结果;
利用3*3卷积对所述第六结果进行卷积操作,得到第七结果;
计算所述第六结果与所述第七结果的和,得到所述膨胀分支的输出。
在上述实施方式中,构建的所述密集分支能够实现模式特征感知,构建的所述膨胀分支具有较大的感受野,能够对摩尔纹信息进行滤波处理,在参数较少的情况下,使得通道更深,进而能够具有更好的表现。
具体地,在构建方向空间感知结构后,所述方法还包括:
在所述方向空间感知结构中,对所述原始特征进行卷积操作,得到卷积结果;
对所述卷积结果进行两级卷积操作;
对所述两级卷积后得到的特征进行通道与空间注意力处理,得到权重图;
对所述卷积结果进行预设的多个方向的滑窗移动操作,得到每个方向上的第一特征;
基于所述多个方向拆分所述权重图,得到与每个方向对应的子权重图;
分别将每个方向上的第一特征与对应的子权重图进行点乘,并拼接点乘后得到的特征,得到拼接特征;
对所述拼接特征进行卷积操作,得到卷积特征;
对所述卷积特征进行所述多个方向的滑窗移动操作,得到每个方向上的第二特征;
分别将每个方向上的第二特征与对应的子权重图进行点乘;
拼接点乘后得到的特征,得到所述方向空间感知结构的输出。
在本实施例中,所述多个方向可以配置为上、下、左、右、左上、右上、左下、右下共8个方向。
在本实施例中,每个卷积操作可以利用1*1卷积。
需要说明的是,不同于只能上下或者左右进行移动的识别方式,本实施例基于通道与空间注意力,能够在多个方向上进行滑动识别,并突出具有摩尔纹的区域,进而能够实现更好的识别效果。
S11,利用内卷算子优化所述初始网络结构,得到第一中间网络结构。
在本发明的至少一个实施例中,所述利用内卷算子优化所述初始网络结构,得到第一中间网络结构包括:
将所述初始网络结构的输入进行通道到空间的转换,得到所述初始网络结构的输入中每个点的内卷核;
获取所述初始网络结构的输入中每个点的邻域特征;
计算每个点的邻域特征与对应的内卷核的内积,得到每个点的矩阵特征;
计算每个点的矩阵特征在预设的第一维度上所有数值的和,并计算每个点的矩阵特征在预设的第二维度上所有数值的和,并作为所述初始网络结构的输出。
具体地,针对输入特征图的每个坐标点上的特征向量,先进行通道到空间的转换,变换展开成核的形状,从而得到每个坐标点上对应的内卷核,再与输入特征图上每个坐标点邻域的特征向量进行矩阵乘法与加法的运算,得到最终输出的特征图。
例如:假设一个坐标点M有C个通道,则这个坐标点M可以记作(1,1,C),另外,这个坐标点M对应的内卷核矩阵L为(K,K,1),将所述坐标点M传播到所述内卷核矩阵L,即进行矩阵相乘运算,即可得到矩阵R;进一步地,将所述矩阵R在第一维度与第二维度上分别做求和运算(例如:将所述第一维度上所有点的取值相加),即可输出矩阵F(1,1,C),其中,所述矩阵F(1,1,C)的前两个维度分别为所述第一维度及所述第二维度。
不同于常规卷积采用滑窗的特征与固定卷积核相乘,本实施方式中内卷的卷积核是由每个像素本身动态生成的,主要用于替换所述密集分支里的残差密集块及所述膨胀分支里的常规卷积,并做内卷结构。通过采用内卷算子,能够加速模型的收敛过程,并减少模型的参数,防止产生过拟合风险。
S12,获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集。
在本发明的至少一个实施例中,所述对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集包括:
对于所述第一图像集中的每张第一图像,在所述第一图像上添加摩尔纹,得到与所述第一图像对应的摩尔纹图像;
将所述第一图像及所述摩尔纹图像确定为一个训练图像组;
整合所有的训练图像组,得到所述第一训练集。
也就是说,在所述第一图像集中,对于同一张图像,同时包含带有摩尔纹的图像及不带有摩尔纹的图像两种版本。
S13,利用所述第一训练集训练所述第一中间网络结构,得到中间模型。
在本发明的至少一个实施例中,所述利用所述第一训练集训练所述第一中间网络结构,得到中间模型包括:
将所述第一训练集中不带有摩尔纹的图像确定为训练目标训练所述第一中间网络结构;
当所述第一中间网络结构的损失函数达到收敛时,停止训练;
将当前的网络确定为所述中间模型。
在本实施方式中,由于在训练过程中以不带有摩尔纹的图像为训练目标,因此,训练得到的所述中间模型是一种能够去除摩尔纹的网络模型。
S14,利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构。
在本实施例中,所述预设网络层可以为能够用于分类的网络层,如全连接层及激活函数层。
在本实施例中,所述指定结构可以为所述中间模型中的小波逆变换分支。
进一步地,在替换后,得到的所述第二中间网络结构可以包括所述小波变换分支、所述配置数量的子分支(包括所述膨胀分支及所述密集分支)、所述全连接层及所述激活函数层。
S15,获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集。
在本发明的至少一个实施例中,所述对所述第二图像集中的图像进行打标签处理,得到第二训练集包括:
对所述第二图像集中的每张第二图像进行打标签处理;
将所述打标签处理后得到的图像所构成的集合确定为所述第二训练集。
例如:对于有摩尔纹的图像,可以利用标签标记为1,对于没有摩尔纹的图像,可以利用标签标记为0。
S16,利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型。
具体地,所述预设网络层包括全连接层及激活函数层,所述指定结构包括所述小波逆变换分支;所述利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型包括:
将所述第二训练集输入至所述第二中间网络结构进行训练;
在训练过程中,冻结所述第二中间网络结构中除所述预设网络层外其他结构的参数;
实时检测所述第二中间网络结构的损失;
当所述第二中间网络结构的损失达到收敛时,停止训练,得到所述摩尔纹识别模型。
在本实施例中,所述激活函数层可以采用sigmoid函数层。
在上述实施方式中,利用所述全连接层及所述激活函数层替换所述中间模型中的小波逆变换分支,训练得到的模型能够进行摩尔纹的识别,同时,在模型训练的过程中,保留了上一阶段训练的能够去除摩尔纹的所述中间模型的权重配置,在具有去除摩尔纹作用的模型的基础上进行学习训练,保留了模型的原有信息,进而能够使后续训练的所述摩尔纹识别模型的识别效果更好。
S17,获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果。
在本发明的至少一个实施例中,所述根据所述摩尔纹识别模型的输出确定摩尔纹识别结果包括:
获取预设阈值;
从所述摩尔纹识别模型的输出中获取预测概率值;
当所述预测概率值大于或者等于所述预设阈值时,确定所述摩尔纹识别结果为所述待识别图像上有摩尔纹;或者
当所述预测概率值小于所述预设阈值时,确定所述摩尔纹识别结果为所述待识别图像上没有摩尔纹。
其中,所述预设阈值可以进行自定义配置,如0.8。
通过上述实施方式,能够结合人工智能手段自动检测图像中是否含有摩尔纹。
在本发明的至少一个实施例中,所述方法还包括:
获取所述摩尔纹识别模型在所述全连接层输出的特征图;
对所述全连接层输出的特征图进行二值化处理,得到二值图;
显示所述二值图。
通过上述实施方式,能够在所述二值图上清楚的显示出哪些位置具有摩尔纹,进而实现可视化效果。
需要说明的是,为了进一步提高数据的安全性,避免数据被恶意篡改,所述摩尔纹识别模型可存储于区块链节点中。
由以上技术方案可以看出,本发明基于小波变换及模式感知记忆构建初始网络结构,利用内卷算子优化所述初始网络结构,得到第一中间网络结构,加速模型的收敛过程,并减少模型的参数,防止产生过拟合风险,获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集,利用所述第一训练集训练所述第一中间网络结构,得到中间模型,利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构,获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集,利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型,获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果,进而结合人工智能手段自动检测图像中是否含有摩尔纹,在具有去除摩尔纹作用的模型的基础上进行学习训练,保留了模型的原有信息,能够使后续训练的所述摩尔纹识别模型的识别效果更好,进而提高了摩尔纹识别的准确率。
本发明实施例还提供一种基于图像识别的摩尔纹识别装置,该基于图像识别的摩尔纹识别装置用于执行前述基于图像识别的摩尔纹识别方法的任一实施例。具体地,请参阅图2,图2是本发明实施例提供的基于图像识别的摩尔纹识别装置的示意性框图。
如图2所示,基于图像识别的摩尔纹识别装置100包括:构建单元101、优化单元102、处理单元103、训练单元104、替换单元105、识别单元106。
构建单元101基于小波变换及模式感知记忆构建初始网络结构。
在本发明的至少一个实施例中,所述构建单元101基于小波变换及模式感知记忆构建初始网络结构包括:
构建具有模式特征感知机制的密集分支,及构建膨胀分支;
根据所述密集分支及所述膨胀分支构建配置数量的子分支,其中,每个子分支包括一个所述密集分支及一个所述膨胀分支;在每个子分支中,所述密集分支的输出与配置参数相乘,得到第一输出,并计算所述第一输出与所述膨胀分支的输出的和,得到每个子分支的输出;所述配置数量的子分支的首尾依次相连,上一个子分支的输出作为下一个子分支的输入;
构建小波变换分支及小波逆变换分支;
结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支,得到所述初始网络结构。
在本实施例中,所述配置数量的子分支可以配置为6个。
在本实施例中,所述配置参数是一种超参数,所述配置参数是根据试验不断调优确定的。
在本实施例中,所述卷积操作可以为经过1*1的卷积的操作。
具体地,在结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支时,在所述初始网络结构中,将所述小波变换分支的输出确定为第一特征图;
对所述第一特征图进行卷积操作,得到第二特征图;
将所述第二特征图输入至所述配置数量的子分支,得到第二输出;
计算所述第二输出与所述第二特征图的和,得到第三特征图;
对所述第三特征图进行卷积操作,得到第四特征图;
将所述第四特征图输入至所述小波逆变换分支进行小波逆变换处理,得到所述初始网络结构的输出。
例如:所述初始网络结构的输出可以为(H/4)*(W/4)*48尺寸的图。
其中,H表示高,W表示宽,能够实现对原始的输入图像的缩放。
在上述实施方式中,结合所述初始网络结构的构成方式,即可确定数据在所述初始网络结构中的流转方式。
在本实施例中,通过两级小波变换(即所述小波变换分支及所述小波逆变换分支),同时结合所述密集分支及所述膨胀分支,得到的所述初始网络结构能够实现对摩尔纹图像中摩尔纹的去除。
具体地,所述构建具有模式特征感知机制的密集分支,及构建膨胀分支包括:
构建方向空间感知结构;
将原始特征输入至所述方向空间感知结构,并对所述方向空间感知结构的输出进行卷积操作,得到第一结果;
将所述第一结果与第一残差密集块的输出及所述配置参数进行相乘,得到第二结果;
将所述原始特征与所述第二结果的和确定为第三结果;
将所述第三结果输入至第二残差密集块进行处理,得到第四结果;
计算所述第一结果与所述第四结果及所述配置参数的乘积,得到第五结果;
将所述第五结果与所述第三结果的和确定为所述密集分支的输出;
将所述原始特征输入至3*3膨胀卷积,得到第六结果;
利用3*3卷积对所述第六结果进行卷积操作,得到第七结果;
计算所述第六结果与所述第七结果的和,得到所述膨胀分支的输出。
在上述实施方式中,构建的所述密集分支能够实现模式特征感知,构建的所述膨胀分支具有较大的感受野,能够对摩尔纹信息进行滤波处理,在参数较少的情况下,使得通道更深,进而能够具有更好的表现。
具体地,在构建方向空间感知结构后,在所述方向空间感知结构中,对所述原始特征进行卷积操作,得到卷积结果;
对所述卷积结果进行两级卷积操作;
对所述两级卷积后得到的特征进行通道与空间注意力处理,得到权重图;
对所述卷积结果进行预设的多个方向的滑窗移动操作,得到每个方向上的第一特征;
基于所述多个方向拆分所述权重图,得到与每个方向对应的子权重图;
分别将每个方向上的第一特征与对应的子权重图进行点乘,并拼接点乘后得到的特征,得到拼接特征;
对所述拼接特征进行卷积操作,得到卷积特征;
对所述卷积特征进行所述多个方向的滑窗移动操作,得到每个方向上的第二特征;
分别将每个方向上的第二特征与对应的子权重图进行点乘;
拼接点乘后得到的特征,得到所述方向空间感知结构的输出。
在本实施例中,所述多个方向可以配置为上、下、左、右、左上、右上、左下、右下共8个方向。
在本实施例中,每个卷积操作可以利用1*1卷积。
需要说明的是,不同于只能上下或者左右进行移动的识别方式,本实施例基于通道与空间注意力,能够在多个方向上进行滑动识别,并突出具有摩尔纹的区域,进而能够实现更好的识别效果。
优化单元102利用内卷算子优化所述初始网络结构,得到第一中间网络结构。
在本发明的至少一个实施例中,所述优化单元102利用内卷算子优化所述初始网络结构,得到第一中间网络结构包括:
将所述初始网络结构的输入进行通道到空间的转换,得到所述初始网络结构的输入中每个点的内卷核;
获取所述初始网络结构的输入中每个点的邻域特征;
计算每个点的邻域特征与对应的内卷核的内积,得到每个点的矩阵特征;
计算每个点的矩阵特征在预设的第一维度上所有数值的和,并计算每个点的矩阵特征在预设的第二维度上所有数值的和,并作为所述初始网络结构的输出。
具体地,针对输入特征图的每个坐标点上的特征向量,先进行通道到空间的转换,变换展开成核的形状,从而得到每个坐标点上对应的内卷核,再与输入特征图上每个坐标点邻域的特征向量进行矩阵乘法与加法的运算,得到最终输出的特征图。
例如:假设一个坐标点M有C个通道,则这个坐标点M可以记作(1,1,C),另外,这个坐标点M对应的内卷核矩阵L为(K,K,1),将所述坐标点M传播到所述内卷核矩阵L,即进行矩阵相乘运算,即可得到矩阵R;进一步地,将所述矩阵R在第一维度与第二维度上分别做求和运算(例如:将所述第一维度上所有点的取值相加),即可输出矩阵F(1,1,C),其中,所述矩阵F(1,1,C)的前两个维度分别为所述第一维度及所述第二维度。
不同于常规卷积采用滑窗的特征与固定卷积核相乘,本实施方式中内卷的卷积核是由每个像素本身动态生成的,主要用于替换所述密集分支里的残差密集块及所述膨胀分支里的常规卷积,并做内卷结构。通过采用内卷算子,能够加速模型的收敛过程,并减少模型的参数,防止产生过拟合风险。
处理单元103获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集。
在本发明的至少一个实施例中,所述处理单元103对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集包括:
对于所述第一图像集中的每张第一图像,在所述第一图像上添加摩尔纹,得到与所述第一图像对应的摩尔纹图像;
将所述第一图像及所述摩尔纹图像确定为一个训练图像组;
整合所有的训练图像组,得到所述第一训练集。
也就是说,在所述第一图像集中,对于同一张图像,同时包含带有摩尔纹的图像及不带有摩尔纹的图像两种版本。
训练单元104利用所述第一训练集训练所述第一中间网络结构,得到中间模型。
在本发明的至少一个实施例中,所述训练单元104利用所述第一训练集训练所述第一中间网络结构,得到中间模型包括:
将所述第一训练集中不带有摩尔纹的图像确定为训练目标训练所述第一中间网络结构;
当所述第一中间网络结构的损失函数达到收敛时,停止训练;
将当前的网络确定为所述中间模型。
在本实施方式中,由于在训练过程中以不带有摩尔纹的图像为训练目标,因此,训练得到的所述中间模型是一种能够去除摩尔纹的网络模型。
替换单元105利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构。
在本实施例中,所述预设网络层可以为能够用于分类的网络层,如全连接层及激活函数层。
在本实施例中,所述指定结构可以为所述中间模型中的小波逆变换分支。
进一步地,在替换后,得到的所述第二中间网络结构可以包括所述小波变换分支、所述配置数量的子分支(包括所述膨胀分支及所述密集分支)、所述全连接层及所述激活函数层。
所述处理单元103获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集。
在本发明的至少一个实施例中,所述处理单元103对所述第二图像集中的图像进行打标签处理,得到第二训练集包括:
对所述第二图像集中的每张第二图像进行打标签处理;
将所述打标签处理后得到的图像所构成的集合确定为所述第二训练集。
例如:对于有摩尔纹的图像,可以利用标签标记为1,对于没有摩尔纹的图像,可以利用标签标记为0。
所述训练单元104利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型。
具体地,所述预设网络层包括全连接层及激活函数层,所述指定结构包括所述小波逆变换分支;所述训练单元104利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型包括:
将所述第二训练集输入至所述第二中间网络结构进行训练;
在训练过程中,冻结所述第二中间网络结构中除所述预设网络层外其他结构的参数;
实时检测所述第二中间网络结构的损失;
当所述第二中间网络结构的损失达到收敛时,停止训练,得到所述摩尔纹识别模型。
在本实施例中,所述激活函数层可以采用sigmoid函数层。
在上述实施方式中,利用所述全连接层及所述激活函数层替换所述中间模型中的小波逆变换分支,训练得到的模型能够进行摩尔纹的识别,同时,在模型训练的过程中,保留了上一阶段训练的能够去除摩尔纹的所述中间模型的权重配置,在具有去除摩尔纹作用的模型的基础上进行学习训练,保留了模型的原有信息,进而能够使后续训练的所述摩尔纹识别模型的识别效果更好。
识别单元106获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果。
在本发明的至少一个实施例中,所述识别单元106根据所述摩尔纹识别模型的输出确定摩尔纹识别结果包括:
获取预设阈值;
从所述摩尔纹识别模型的输出中获取预测概率值;
当所述预测概率值大于或者等于所述预设阈值时,确定所述摩尔纹识别结果为所述待识别图像上有摩尔纹;或者
当所述预测概率值小于所述预设阈值时,确定所述摩尔纹识别结果为所述待识别图像上没有摩尔纹。
其中,所述预设阈值可以进行自定义配置,如0.8。
通过上述实施方式,能够结合人工智能手段自动检测图像中是否含有摩尔纹。
在本发明的至少一个实施例中,获取所述摩尔纹识别模型在所述全连接层输出的特征图;
对所述全连接层输出的特征图进行二值化处理,得到二值图;
显示所述二值图。
通过上述实施方式,能够在所述二值图上清楚的显示出哪些位置具有摩尔纹,进而实现可视化效果。
需要说明的是,为了进一步提高数据的安全性,避免数据被恶意篡改,所述摩尔纹识别模型可存储于区块链节点中。
由以上技术方案可以看出,本发明基于小波变换及模式感知记忆构建初始网络结构,利用内卷算子优化所述初始网络结构,得到第一中间网络结构,加速模型的收敛过程,并减少模型的参数,防止产生过拟合风险,获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集,利用所述第一训练集训练所述第一中间网络结构,得到中间模型,利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构,获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集,利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型,获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果,进而结合人工智能手段自动检测图像中是否含有摩尔纹,在具有去除摩尔纹作用的模型的基础上进行学习训练,保留了模型的原有信息,能够使后续训练的所述摩尔纹识别模型的识别效果更好,进而提高了摩尔纹识别的准确率。
上述基于图像识别的摩尔纹识别装置可以实现为计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
请参阅图3,图3是本发明实施例提供的计算机设备的示意性框图。该计算机设备500是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参阅图3,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括存储介质503和内存储器504。
该存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于图像识别的摩尔纹识别方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于图像识别的摩尔纹识别方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图3中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现本发明实施例公开的基于图像识别的摩尔纹识别方法。
本领域技术人员可以理解,图3中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图3所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质,也可以为易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现本发明实施例公开的基于图像识别的摩尔纹识别方法。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
本发明可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种基于图像识别的摩尔纹识别方法,其特征在于,包括:
基于小波变换及模式感知记忆构建初始网络结构;
利用内卷算子优化所述初始网络结构,得到第一中间网络结构;
获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集;
利用所述第一训练集训练所述第一中间网络结构,得到中间模型;
利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构;
获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集;
利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型;
获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果;
其中,所述基于小波变换及模式感知记忆构建初始网络结构包括:
构建具有模式特征感知机制的密集分支,及构建膨胀分支;
根据所述密集分支及所述膨胀分支构建配置数量的子分支,其中,每个子分支包括一个所述密集分支及一个所述膨胀分支;在每个子分支中,所述密集分支的输出与配置参数相乘,得到第一输出,并计算所述第一输出与所述膨胀分支的输出的和,得到每个子分支的输出;所述配置数量的子分支的首尾依次相连,上一个子分支的输出作为下一个子分支的输入;
构建小波变换分支及小波逆变换分支;
结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支,得到所述初始网络结构。
2.根据权利要求1所述的基于图像识别的摩尔纹识别方法,其特征在于,在结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支时,所述方法还包括:
在所述初始网络结构中,将所述小波变换分支的输出确定为第一特征图;
对所述第一特征图进行卷积操作,得到第二特征图;
将所述第二特征图输入至所述配置数量的子分支,得到第二输出;
计算所述第二输出与所述第二特征图的和,得到第三特征图;
对所述第三特征图进行卷积操作,得到第四特征图;
将所述第四特征图输入至所述小波逆变换分支进行小波逆变换处理,得到所述初始网络结构的输出。
3.根据权利要求1所述的基于图像识别的摩尔纹识别方法,其特征在于,所述构建具有模式特征感知机制的密集分支,及构建膨胀分支包括:
构建方向空间感知结构;
将原始特征输入至所述方向空间感知结构,并对所述方向空间感知结构的输出进行卷积操作,得到第一结果;
将所述第一结果与第一残差密集块的输出及所述配置参数进行相乘,得到第二结果;
将所述原始特征与所述第二结果的和确定为第三结果;
将所述第三结果输入至第二残差密集块进行处理,得到第四结果;
计算所述第一结果与所述第四结果及所述配置参数的乘积,得到第五结果;
将所述第五结果与所述第三结果的和确定为所述密集分支的输出;
将所述原始特征输入至3*3膨胀卷积,得到第六结果;
利用3*3卷积对所述第六结果进行卷积操作,得到第七结果;
计算所述第六结果与所述第七结果的和,得到所述膨胀分支的输出。
4.根据权利要求3所述的基于图像识别的摩尔纹识别方法,其特征在于,在构建方向空间感知结构后,所述方法还包括:
在所述方向空间感知结构中,对所述原始特征进行卷积操作,得到卷积结果;
对所述卷积结果进行两级卷积操作;
对所述两级卷积后得到的特征进行通道与空间注意力处理,得到权重图;
对所述卷积结果进行预设的多个方向的滑窗移动操作,得到每个方向上的第一特征;
基于所述多个方向拆分所述权重图,得到与每个方向对应的子权重图;
分别将每个方向上的第一特征与对应的子权重图进行点乘,并拼接点乘后得到的特征,得到拼接特征;
对所述拼接特征进行卷积操作,得到卷积特征;
对所述卷积特征进行所述多个方向的滑窗移动操作,得到每个方向上的第二特征;
分别将每个方向上的第二特征与对应的子权重图进行点乘;
拼接点乘后得到的特征,得到所述方向空间感知结构的输出。
5.根据权利要求1所述的基于图像识别的摩尔纹识别方法,其特征在于,所述利用内卷算子优化所述初始网络结构,得到第一中间网络结构包括:
将所述初始网络结构的输入进行通道到空间的转换,得到所述初始网络结构的输入中每个点的内卷核;
获取所述初始网络结构的输入中每个点的邻域特征;
计算每个点的邻域特征与对应的内卷核的内积,得到每个点的矩阵特征;
计算每个点的矩阵特征在预设的第一维度上所有数值的和,并计算每个点的矩阵特征在预设的第二维度上所有数值的和,并作为所述初始网络结构的输出。
6.根据权利要求1所述的基于图像识别的摩尔纹识别方法,其特征在于,所述预设网络层包括全连接层及激活函数层,所述指定结构包括所述小波逆变换分支;所述利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型包括:
将所述第二训练集输入至所述第二中间网络结构进行训练;
在训练过程中,冻结所述第二中间网络结构中除所述预设网络层外其他结构的参数;
实时检测所述第二中间网络结构的损失;
当所述第二中间网络结构的损失达到收敛时,停止训练,得到所述摩尔纹识别模型。
7.一种基于图像识别的摩尔纹识别装置,其特征在于,包括:
构建单元,用于基于小波变换及模式感知记忆构建初始网络结构;
优化单元,用于利用内卷算子优化所述初始网络结构,得到第一中间网络结构;
处理单元,用于获取第一图像集,并对所述第一图像集中的图像进行摩尔纹添加处理,得到第一训练集;
训练单元,用于利用所述第一训练集训练所述第一中间网络结构,得到中间模型;
替换单元,用于利用预设网络层替换所述中间模型中的指定结构,得到第二中间网络结构;
所述处理单元,还用于获取第二图像集,并对所述第二图像集中的图像进行打标签处理,得到第二训练集;
所述训练单元,还用于利用所述第二训练集训练所述第二中间网络结构,得到摩尔纹识别模型;
识别单元,用于获取待识别图像,将所述待识别图像输入至所述摩尔纹识别模型,并根据所述摩尔纹识别模型的输出确定摩尔纹识别结果;
其中,所述构建单元基于小波变换及模式感知记忆构建初始网络结构包括:
构建具有模式特征感知机制的密集分支,及构建膨胀分支;
根据所述密集分支及所述膨胀分支构建配置数量的子分支,其中,每个子分支包括一个所述密集分支及一个所述膨胀分支;在每个子分支中,所述密集分支的输出与配置参数相乘,得到第一输出,并计算所述第一输出与所述膨胀分支的输出的和,得到每个子分支的输出;所述配置数量的子分支的首尾依次相连,上一个子分支的输出作为下一个子分支的输入;
构建小波变换分支及小波逆变换分支;
结合卷积操作依次连接所述小波变换分支、所述配置数量的子分支及所述小波逆变换分支,得到所述初始网络结构。
8.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于图像识别的摩尔纹识别方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6任一项所述的基于图像识别的摩尔纹识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012740.3A CN113723515B (zh) | 2021-08-31 | 2021-08-31 | 基于图像识别的摩尔纹识别方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111012740.3A CN113723515B (zh) | 2021-08-31 | 2021-08-31 | 基于图像识别的摩尔纹识别方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113723515A CN113723515A (zh) | 2021-11-30 |
CN113723515B true CN113723515B (zh) | 2023-08-18 |
Family
ID=78679756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111012740.3A Active CN113723515B (zh) | 2021-08-31 | 2021-08-31 | 基于图像识别的摩尔纹识别方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723515B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114581860A (zh) * | 2022-05-09 | 2022-06-03 | 武汉纺织大学 | 一种基于改进的YOLOv5模型的安全帽检测算法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007198912A (ja) * | 2006-01-26 | 2007-08-09 | Sharp Corp | 画像検査装置、画像検査方法、コンピュータを画像検査装置として機能させるためのプログラムおよび記録媒体 |
WO2020077866A1 (zh) * | 2018-10-17 | 2020-04-23 | 平安科技(深圳)有限公司 | 基于摩尔纹的图像识别方法、装置、设备和存储介质 |
CN111369450A (zh) * | 2020-02-21 | 2020-07-03 | 华为技术有限公司 | 去除摩尔纹的方法与装置 |
WO2021134874A1 (zh) * | 2019-12-31 | 2021-07-08 | 深圳大学 | 二维码去摩尔纹的深度残差网络的训练方法 |
CN113160086A (zh) * | 2021-04-28 | 2021-07-23 | 东南大学 | 基于深度学习的图像去摩尔纹方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2014202322A1 (en) * | 2014-04-29 | 2015-11-12 | Canon Kabushiki Kaisha | Wavelet denoising of fringe image |
-
2021
- 2021-08-31 CN CN202111012740.3A patent/CN113723515B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007198912A (ja) * | 2006-01-26 | 2007-08-09 | Sharp Corp | 画像検査装置、画像検査方法、コンピュータを画像検査装置として機能させるためのプログラムおよび記録媒体 |
WO2020077866A1 (zh) * | 2018-10-17 | 2020-04-23 | 平安科技(深圳)有限公司 | 基于摩尔纹的图像识别方法、装置、设备和存储介质 |
WO2021134874A1 (zh) * | 2019-12-31 | 2021-07-08 | 深圳大学 | 二维码去摩尔纹的深度残差网络的训练方法 |
CN111369450A (zh) * | 2020-02-21 | 2020-07-03 | 华为技术有限公司 | 去除摩尔纹的方法与装置 |
CN113160086A (zh) * | 2021-04-28 | 2021-07-23 | 东南大学 | 基于深度学习的图像去摩尔纹方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113723515A (zh) | 2021-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898696B (zh) | 伪标签及标签预测模型的生成方法、装置、介质及设备 | |
CN108229343B (zh) | 目标对象关键点检测方法、深度学习神经网络及装置 | |
CN114067321B (zh) | 一种文本检测模型训练方法、装置、设备及存储介质 | |
JP6612486B1 (ja) | 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム | |
KR20120066462A (ko) | 얼굴 인식 방법 및 시스템, 얼굴 인식을 위한 학습용 특징 벡터 추출 장치 및 테스트용 특징 벡터 추출 장치 | |
CN114187441A (zh) | 接触网部件缺陷检测方法、装置、电子设备及存储介质 | |
CN112508078A (zh) | 图像多任务多标签识别方法、系统、设备及介质 | |
CN114492601A (zh) | 资源分类模型的训练方法、装置、电子设备及存储介质 | |
CN111626311A (zh) | 一种异构图数据处理方法和装置 | |
CN114549369A (zh) | 数据修复方法、装置、计算机及可读存储介质 | |
CN113723515B (zh) | 基于图像识别的摩尔纹识别方法、装置、设备及介质 | |
CN110135428A (zh) | 图像分割处理方法和装置 | |
CN116563840B (zh) | 基于弱监督跨模态对比学习的场景文本检测与识别方法 | |
US20130121558A1 (en) | Point Selection in Bundle Adjustment | |
CN117636353A (zh) | 待标注图像分割方法、装置、电子设备和计算机可读介质 | |
CN113704276A (zh) | 地图更新方法、装置、电子设备及计算机可读存储介质 | |
AU2016256681B2 (en) | Normalized probability of change algorithm for image processing | |
CN113591892A (zh) | 一种训练数据的处理方法及装置 | |
CN112116585A (zh) | 图像移除篡改盲检测方法、系统、设备及存储介质 | |
CN112132031B (zh) | 车款识别方法、装置、电子设备及存储介质 | |
CN112487943B (zh) | 关键帧去重的方法、装置和电子设备 | |
CN115205301A (zh) | 基于特征空间多视角分析的影像分割方法和装置 | |
CN113963257A (zh) | 水下目标检测方法、装置、电子设备及存储介质 | |
CN114022458A (zh) | 骨架检测方法、装置、电子设备和计算机可读存储介质 | |
CN115471714A (zh) | 数据处理方法、装置、计算设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |