CN112819007A - 图像识别方法、装置、电子设备及存储介质 - Google Patents

图像识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112819007A
CN112819007A CN202110017609.XA CN202110017609A CN112819007A CN 112819007 A CN112819007 A CN 112819007A CN 202110017609 A CN202110017609 A CN 202110017609A CN 112819007 A CN112819007 A CN 112819007A
Authority
CN
China
Prior art keywords
image
feature
matrix
enhanced
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110017609.XA
Other languages
English (en)
Other versions
CN112819007B (zh
Inventor
宋希彬
周定富
方进
张良俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Baidu USA LLC
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Baidu USA LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd, Baidu USA LLC filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110017609.XA priority Critical patent/CN112819007B/zh
Publication of CN112819007A publication Critical patent/CN112819007A/zh
Application granted granted Critical
Publication of CN112819007B publication Critical patent/CN112819007B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features

Abstract

本公开提出一种图像识别方法及装置,涉及图像处理技术领域,尤其涉及计算机视觉、深度学习等人工智能领域,具体实现方案为获取待识别图像,并提取待识别图像的图像特征;基于多个方向滤波器对图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对局部图像特征进行融合,得到融合图像特征;对融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征;对融合图像特征在像素上进行增强,以获取第二增强图像特征;基于第一增强图像特征和第二增强图像特征,获取待识别图像的纹理类型。本公开中,首先基于方向滤波器将各个方向的干扰特征进行滤除,再对全方向上的融合图像特征分别在两个方面进行特征增强,强化了图像特征的表达能力。

Description

图像识别方法、装置、电子设备及存储介质
技术领域
本公开涉及图像处理技术领域,尤其涉及计算机视觉、深度学习等人工智能技术领域。
背景技术
基于传统机器学习或深度学习均需要额外的训练数据集,对图像的纹理信息进行预测,然而传统机器学习的非线性表达能力往往有限,深度学习存在图像特征提取不充分的问题,从而导致图像纹理信息的预测准确率不高。
发明内容
本公开提供了一种图像识别方法、装置、电子设备以及存储介质、计算机程序产品。
根据本公开的一方面,提出了一种图像识别方法,包括获取待识别图像,并提取所述待识别图像的图像特征;基于多个方向滤波器对所述图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对所述局部图像特征进行融合,得到融合图像特征;对所述融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征;对所述融合图像特征在像素上进行增强,以获取第二增强图像特征;基于所述第一增强图像特征和所述第二增强图像特征,获取所述待识别图像的纹理类型。
根据本公开的第二方面,提出了一种图像识别装置,包括特征提取模块,用于获取待识别图像,并提取所述待识别图像的图像特征;滤波融合模块,用于基于多个方向滤波器对所述图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对所述局部图像特征进行融合,得到融合图像特征;第一增强模块,用于对所述融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征;第二增强模块,用于对所述融合图像特征在像素上进行增强,以获取第二增强图像特征;纹理识别模块,用于基于所述第一增强图像特征和所述第二增强图像特征,获取所述待识别图像的纹理类型。
根据本公开的第三方面,提出了一种电子设备,其中,电子设备包括处理器和存储器;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述第一方面提出的图像识别方法。
根据本公开的第四方面,提出了一种计算机可读存储介质,其上存储有计算机程序,包括该程序被处理器执行时实现如上述第一方面提出的图像识别方法。计算机程序产品,包括当所述计算机程序产品中的指令处理器执行时实现如上述第一方面提出的图像识别方法。
根据本公开的第五方面,提出了一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令处理器执行时实现如上述第一方面提出的图像识别方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开一实施例的图像识别方法的流程示意图;
图2是本公开另一实施例的图像识别方法的流程示意图;
图3是本公开另一实施例的图像识别方法的流程示意图;
图4是本公开另一实施例的图像识别方法的流程示意图;
图5是本公开另一实施例的图像识别方法的流程示意图;
图6是本公开一实施例的图像识别装置的框图;
图7是本公开一实施例的图像识别装置的框图;
图8是本公开一实施例的电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图像处理(Image Processing),用计算机对图像进行分析,以达到所需结果的技术。又称影像处理。图像处理一般指数字图像处理。数字图像是指用工业相机、摄像机、扫描仪等设备经过拍摄得到的一个大的二维数组,该数组的元素称为像素,其值称为灰度值。图像处理技术一般包括图像压缩,增强和复原,匹配、描述和识别3个部分。
深度学习(Deep Learning,简称DL),是机器学习(Machine Learning,简称ML)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能。深度学习是学习样本数据的内在律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
计算机视觉(Computer Vision),是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
人工智能(Artificial Intelligence,简称AI),是研究使计算机来模拟人生的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术,也有软件层面的技术。人工智能硬件技术一般包括计算机视觉技术、语音识别技术、自然语言处理技术以及及其学习/深度学习、大数据处理技术、知识图谱技术等几大方面。
图1是本公开一实施例的图像识别方法的流程示意图。如图所示,该图像识别方法包括以下步骤:
S101,获取待识别图像,并提取待识别图像的图像特征。
本公开实施例中,待识别图像可以为预先采集的图像,也可以为上述实时采集的图像。可选地,图像为彩色图像。
在获取到待识别图像后,为了对待识别图像进行识别或者分类,需要对待识别图像的图像特征进行提取,图像特征可以包括但不限于以下特征:图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。
可选地,可以通过深度学习模型或者机器学习模型提取待识别图像的图像特征,即将待识别图像输入到训练好的特征提取网络中,基于该特征提取网络可以提取到图像特征。
S102,基于多个方向滤波器对图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对局部图像特征进行融合,得到融合图像特征。
本公开实施例中,在提取图像特征后,为了增强图像特征的表达能力,可以部署一组滤波器,该组滤波器包括多个方向滤波器,每个方向滤波器可以提取到相应方向上的局部特征,通过方向滤波器的处理,可以剔除到该方向的干扰特征,从而有利于图像纹理类型的识别。比如但不限于0°滤波器、45°滤波器、90°滤波器、135°滤波器、180°滤波器等。进一步地,在通过多个方向角度的滤波器后,获取到了不同方向角度下的局部图像特征,然后将若干不同方向角度下的局部图像特征进行合并,以获取到全方向的融合图像特征。
S103,对融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征。
实现中,在待识别图像的特征提取过程中,需要通过多个特征提取通道,来提取待识别图像的图像特征。针对相关技术中存在的图像特征提取不充分的问题,本公开实施例中,可以在特征提取通道上进行特征增强,进而获取第一增强图像特性。可选地,基于多个卷积网络对融合图像特征进行卷积处理,获取多个特征提取通道的增强权重,基于通道级别的增强权重和图像特征,可以获取到第一增强图像特征。
S104,对融合图像特征在像素上进行增强,以获取第二增强图像特征。
图像是由多个像素组成,每个像素对图像特征的提取具有一定的贡献,为了解决相关技术中存在的图像特征提取不充分的问题,本公开实施例中,可以进行像素级别的特征增强,进而获取到第二增强图像特性。可选地,基于多个卷积网络对融合图像特征进行卷积操作,获取每个像素的增强权重,基于该像素级别的增强权重和图像特征,可以获取到第二增强图像特征。
S105,基于第一增强图像特征和第二增强图像特征,获取待识别图像的纹理类型。
在获取到第一增强图像特征和第二增强图像特征后,对两个增强图像特征进行融合,获取到一个最终的图像特征。可选地,对第一增强图像特征和第二增强图像特征进行加权,得到一个最终的目标图像特征。通过将第一增强图像特征和第二增强图像特征的融合,使得图像特征的强度更高,更有利于提高图像识别的准确性。
在获取到最终的目标图像特征后,基于最终的目标图像特征进行分类识别,可以获取到待识别图像的纹理类型。可选地,基于训练好的纹理分类模型,对目标图像特征进行分类识别,最终输出待识别图像对应的纹理类型。例如,纹理类型可以包括土壤材质,路面,树叶等类别。
本公开提供出的图像识别方法,获取待识别图像,并基于多个方向的滤波器提取待识别图像的局部图像特征并进行合并操作获取融合图像特征,对融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征,并对融合图像特征在像素上进行增强,以获取第二增强图像特征,基于第一增强图像特征和第二增强图像特征,获取待识别图像的纹理类型。本公开中,首先基于方向滤波器将各个方向的干扰特征进行滤除,再对全方向上的融合图像特征分别在两个方面进行特征增强,以增强特征的表达能力,并且可以提供充足的图像特征,以提高图像的纹理类型分类识别的准确性。
图2是本公开另一实施例的图像识别方法的流程-示意图。如图2所示,该图像识别方法具体步骤如下:
S201,获取待识别图像,并提取待识别图像的图像特征。
S202,基于多个方向滤波器对图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对局部图像特征进行融合,得到融合图像特征。
步骤S202的介绍可参见上述S102相关内容记载,此处不再赘述。
S203,对融合图像特征进行降维处理,得到第一降维特征矩阵和第二降维特征矩阵。
其中,第一降维特征矩阵中的同一行的特征元素属于同一个特征提取通道,一个列元素对应一个像素,第二降维特征矩阵为第一降维特征矩阵的转置矩阵。本公开中,第一降维特征矩阵和第二降维特征矩阵用于获取第一增强图像特征和第二增强图像特征。
融合图像特征可以从多个维度提现同一个特征信息,例如可以从特征提取通道、特征长度和特征宽度等维度来描述一个特征信息。为了降低数据处理的量,以及可以实现矩阵的相乘,本公开实施例中,可以对融合图像特征进行降维处理,可选地,可以将融合图像特征中的特征长度和特征宽度两个维度进行融合,以得到第一降维特征矩阵和第二降维特征矩阵。
S204,基于第一降维特征矩阵和第二降维特征矩阵,获取第一增强图像特征和第二增强图像特征。
获取第一增强图像特征的过程包括:将第一降维特征矩阵和第二降维特征矩阵相乘,获取特征提取通道对应的第一权重矩阵,再将基于融合图像特征和第一权重矩阵,获取第一增强图像特征。可选地,对融合图像特征进行卷积操作,获取第一中间特征矩阵,将第一权重矩阵与第一中间特征矩阵相乘,得到第二中间特征矩阵,将第一中间特征矩阵和第二中间特征矩阵相加,得到第一增强图像特征。本公开实施例中,从特征提取通道上进行特征增强,即增强特征通道的特征提取能力,使得提取出图像特征的强度较高,进而能够提高图像识别的准确性。
下面结合图3对第一增强图像特征获取过程进行解释说明,如图3所示,通道级别的特征增强模块包括卷积单元31、卷积单元32、卷积单元33、第一矩阵乘法单元34、归一化单元35、第二矩阵乘法单元36和加法器37。
其中,融合图像特征F(c×w×h)作为通道级别的特征增强模块的输入,其中,C表示特征提取通道,W表示特征宽度,H表示特征长度。
由卷积单元31和卷积单元32分别对融合图像特征F(c×w×h)进行卷积操作,以对融合图像特征F(c×w×h)进行降维处理,得到第一降维特征矩阵Qc(c×(h*w))和第二降维特征矩阵Hc((h*w)×c)。其中,Hc((h*w)×c)为Qc(c×(h*w))的转置矩阵。进一步地,将Qc(c×(h*w))与Hc((h*w)×c)输入第一矩阵乘法单元34,在第一矩阵乘法单元34内Qc(c×(h*w))与Hc((h*w)×c)进行矩阵乘法,输出第一权重矩阵Mc(c×c),并将Mc(c×c)输入归一化单元35中进行归一化(softmax)操作后获得特征提取通道对应的第一权重矩阵M’c(c×c)
由卷积单元33对融合图像特征F(c×w×h)进行卷积操作,得到一个第一中间特征矩阵Fc(c×h×w)1,最后通过第二矩阵乘法单元36,在第二矩阵乘法单元36内M’c(c×c)和Fc(c×h×w)1进行矩阵乘法,获得增强后的第二中间特征矩阵Fh(c×h×w)1
进一步地,通过加法器37将第二中间特征矩阵Fh(c×h×w)1与第一中间特征矩阵Fc(c×h×w)1进行相加,获得最终的第一增强图像特征F1
获取第二增强图像特征的过程包括:将第二降维特征矩阵和第一降维特征矩阵相乘,获取像素对应的第二权重矩阵,并基于融合图像特征和第二权重矩阵,获取第二增强图像特征。可选地,对融合图像特征进行卷积操作,获取第三中间特征矩阵,再将第二权重矩阵与第三中间特征矩阵相乘,得到第四中间特征矩阵,将第三中间特征矩阵和第四中间特征矩阵相加,得到第二增强图像特征。本公开实施例中,从像素上进行特征增强,以提高图像特征的表达能力,进而能够提高图像识别的准确性。
下面结合图4对第二增强图像特征获取过程进行解释说明,如图4所示,像素级别的特征增强模块包括卷积单元41、卷积单元42、卷积单元43、第一矩阵乘法单元44、归一化单元45、第二矩阵乘法单元46和加法器47。
其中,融合图像特征F(c×w×h)作为像素级别的特征增强模块的输入。
由卷积单元41和卷积单元42分别对融合图像特征F(c×w×h)进行卷积操作,以对融合图像特征F(c×w×h)进行降维处理,得到第一降维特征矩阵Qc(c×(h*w))和第二降维特征矩阵Hc((h*w)×c)。其中,Hc((h*w)×c)为Qc(c×(h*w))的转置矩阵。进一步地,将Hc((h*w)×c)与Qc(c×(h*w))输入第一矩阵乘法单元44,在第一矩阵乘法单元44内Hc((h*w)×c)与Qc(c×(h*w))进行矩阵乘法后,可以获得第二权重矩阵MP((h*w)×(h*w)),并将MP((h*w)×(h*w))输入归一化单元45中进行归一化操作后获得像素对应的第二权重矩阵M’P((h*w)×(h*w))
由卷积单元43对融合图像特征F(c×w×h)进行卷积操作,得到一个第三中间特征矩阵Fc(c×h×w)2,最后通过第二矩阵乘法单元46,在第二矩阵乘法单元46内M’P((h*w)×(h*w))和Fc(c×h×w)2进行矩阵乘法,获得增强后的第四中间特征矩阵Fh(c×h×w)2
进一步地,通过加法器47将第四中间特征矩阵Fh(c×h×w)2与第三中间特征矩阵Fc(c×h×w)2进行通道上相加,获得最终的第二增强图像特征F2
获取第二增强图像特征的过程包括:将第二降维特征矩阵和第一降维特征矩阵相乘,获取像素对应的第二权重矩阵,并基于融合图像特征和第二权重矩阵,获取第二增强图像特征。可选地,对融合图像特征进行卷积操作,获取第三中间特征矩阵,再将第二权重矩阵与第三中间特征矩阵相乘,得到第四中间特征矩阵,将第三中间特征矩阵和第四中间特征矩阵相加,得到第二增强图像特征。
S205,对第一增强图像特征和第二增强图像特征进行加权,得到目标图像特征。
本公开实施例中,目标图像特征的获取需要基于第一增强图像特征和第二增强图像特征进行加权计算。进一步地,设定目标图像特征为F,如图3和图4所示,融合图像特征经过通道级增强获取到的图像特征为F1,融合图像特征通过像素级增强获取到的图像特征为F2,获取增强后的特征后,基于第一增强图像特征和第二增强图像特征的权重融合F1和F2,即F=a*F1+b*F2。其中,a和b为可学习的权重参数,可以理解为,权重参数a和b是根据本公开实施例中图像纹理识别模型中的训练过程和测试过程进行调试获取。
S206,基于目标图像特征,获取待识别图像的纹理类型。
本公开提供出的图像识别方法,获取待识别图像,并基于多个方向的滤波器提取待识别图像的局部图像特征,后进行合并操作获取融合图像特征。对融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征,对融合图像特征在像素上进行增强,以获取第二增强图像特征,基于第一增强图像特征和第二增强图像特征,获取待识别图像的纹理类型。本公开中,在获取到融合图像特征后,分别在两个方面进行特征增强,以增强特征的表达能力,并且可以提供充足的图像特征,以提高图像的纹理类型分类识别的准确性。
下面对上述实施例中涉及的图像纹理识别模型进行解释说明。首先构建一个非线性映射模型,然后采集训练数据集,其中,训练数据集包括样本图像和样本图像所标记的纹理类别。基于该训练数据集对构建的非线性映射模型进行训练,最终得到一个能够识别图像纹理的图像纹理识别模型。
可选地,如图5所示,图像分类识别模型的网络结构可以包括:特征提取层51、和滤波层52、特征融合层53、特征增强层54,其中特征增强层包括通道级别特征增强子层541和像素级别特征增强子层542、特征融合层55、全连接(Fully Connected,FC)层56和L2范数归一化(L2 normalize,L2 nom)层57。将待识别图像输入到如图5所示的图像分类识别模型中,可以先经过特征提取层51提取图像特征,其中,特征提取层51先对输入的待识别图像进行特征提取,获取到图像特征,再将图像特征输入到滤波层52,由滤波层52基于不同方向的滤波器对图像特征进行局部特征提取,后经过特征融合层53获取融合图像特征,然后再经过特征增强层54进行通道级别和像素级别的特征增强,输入至特征融合层55进行特征融合,再输入到FC层56,由FC层56对融合后的图像特征进行全连接,最后输入到L2 nom层57中进行映射,得到待识别图像的纹理类别。
与上述几种实施例提供的图像识别方法相对应,本公开的一个实施例还提供一种图像识别装置,由于本公开实施例提供的图像纹理特征的提取装置与上述几种实施例提供的图像识别方法相对应,因此在图像识别方法的实施方式也适用于本公开实施例提供的图像识别方法装置,在下述实施例中不再详细描述。
图6是本公开另一实施例的图像识别装置的结构示意图。如图6所示,该图像识别装置600包括:特征提取模块61、滤波融合模块62、第一增强模块63、第二增强模块64和纹理识别模块65。其中:
特征提取模块61,用于获取待识别图像,并提取待识别图像的图像特征;
滤波融合模块62,用于基于多个方向滤波器对图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对局部图像特征进行融合,得到融合图像特征;
第一增强模块63,用于对融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征;
第二增强模块64,用于对融合图像特征在像素上进行增强,以获取第二增强图像特征;
纹理识别模块65,用于基于第一增强图像特征和第二增强图像特征,获取待识别图像的纹理类型。
本公开提供出的图像识别装置,获取待识别图像,并基于多个方向的滤波器提取待识别图像的局部图像特征并进行合并操作获取融合图像特征,对融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征,对融合图像特征在像素上进行增强,以获取第二增强图像特征,基于第一增强图像特征和第二增强图像特征,获取待识别图像的纹理类型。本公开中,首先基于方向滤波器将各个方向的干扰特征进行滤除,再对全方向上的融合图像特征分别在两个方面进行特征增强,以增强特征的表达能力,并且可以提供充足的图像特征,以提高图像的纹理类型分类识别的准确性。
图7是本公开另一实施例的图像识别装置的结构示意图。如图7所示,该图像识别装置700包括:特征提取模块71、滤波融合模块72、第一增强模块73、第二增强模块74、纹理识别模块75和降维模块76。
需要说明的是,特征提取模块71、滤波融合模块72、第一增强模块73、第二增强模块74、纹理识别模块75与提取模块61、滤波融合模块62、第一增强模块63、第二增强模块64和纹理识别模块65,具有相同的结构和功能。
本公开实施例中,降维模块76,用于对融合图像特征进行降维处理,得到第一降维特征矩阵和第二降维特征矩阵,其中,第一降维特征矩阵中的同一行的特征元素属于同一个特征提取通道,一个列元素对应一个像素,第二降维特征矩阵为第一降维特征矩阵的转置矩阵;其中,第一降维特征矩阵和第二降维特征矩阵用于获取第一增强图像特征和第二增强图像特征。
本公开实施例中,第一增强模块73包括第一矩阵相乘单元731和第一获取单元732。
第一矩阵相乘单元731,用于将第一降维特征矩阵和第二降维特征矩阵相乘,获取特征提取通道对应的第一权重矩阵。
第一获取单元732,用于基于图像特征和第一权重矩阵,获取第一增强图像特征。
其中,第一获取单元732进一步用于,对融合图像特征进行卷积操作,获取第一中间特征矩阵;将第一权重矩阵与第一中间特征矩阵相乘,得到第二中间特征矩阵;将第一中间特征矩阵和第二中间特征矩阵相加,得到第一增强图像特征。
本公开实施例中,第二增强模块74包括第二矩阵相乘单元741和第二获取单元742。
第二矩阵相乘单元741,用于将第二降维特征矩阵和第一降维特征矩阵相乘,获取像素对应的第二权重矩阵。
第二获取单元742,用于基于融合图像特征和第二权重矩阵,获取第二增强图像特征。
其中,第二获取单元742进一步用于,对融合图像特征进行卷积操作,获取第三中间特征矩阵;将第二权重矩阵与第三中间特征矩阵相乘,得到第四中间特征矩阵;将第三中间特征矩阵和第四中间特征矩阵相加,得到第二增强图像特征
本公开实施例中,融合图像特征包括特征提取通道、特征长度和特征宽度,可选地,降维模块76进一步用于,将融合图像特征中的特征长度和特征宽度两个维度进行融合,得到第一降维特征矩阵和第二降维特征矩阵。
本公开实施例中纹理识别模块75包括:加权单元751和识别单元752。
加权单元751用于对第一增强图像特征和第二增强图像特征进行加权,得到目标图像特征。
识别单元752,用于基于目标图像特征,识别待识别图像的纹理类型。
本公开中,首先基于方向滤波器将各个方向的干扰特征进行滤除,再对全方向上的融合图像特征分别在两个方面进行特征增强,以增强特征的表达能力,并且可以提供充足的融合图像特征,以提高图像的纹理类型分类识别的准确性。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图像识别方法。例如,在一些实施例中,图像识别方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的图像识别方法一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像识别方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务端可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(“Virtual Private Server”,或简称“VPS”)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合区块链的服务器
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (19)

1.一种图像识别方法,包括:
获取待识别图像,并提取所述待识别图像的图像特征;
基于多个方向滤波器对所述图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对所述局部图像特征进行融合,得到融合图像特征;
对所述融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征;
对所述融合图像特征在像素上进行增强,以获取第二增强图像特征;
基于所述第一增强图像特征和所述第二增强图像特征,获取所述待识别图像的纹理类型。
2.根据权利要求1所述的图像识别方法,其中,所述得到融合图像特征之后,还包括:
对所述融合图像特征进行降维处理,得到第一降维特征矩阵和第二降维特征矩阵,其中,所述第一降维特征矩阵中的同一行的特征元素属于同一个所述特征提取通道,一个列元素对应一个像素,所述第二降维特征矩阵为所述第一降维特征矩阵的转置矩阵;
其中,所述第一降维特征矩阵和所述第二降维特征矩阵用于获取所述第一增强图像特征和所述第二增强图像特征。
3.根据权利要求2所述的图像识别方法,其中,所述对所述融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征,包括:
将所述第一降维特征矩阵和所述第二降维特征矩阵相乘,获取所述特征提取通道对应的第一权重矩阵;
基于所述融合图像特征和所述第一权重矩阵,获取所述第一增强图像特征。
4.根据权利要求3所述的图像识别方法,其中,所述基于所述融合图像特征和所述第一权重矩阵,获取所述第一增强图像特征,包括:
对所述融合图像特征进行卷积操作,获取第一中间特征矩阵;
将所述第一权重矩阵与所述第一中间特征矩阵相乘,得到第二中间特征矩阵;
将所述第一中间特征矩阵和所述第二中间特征矩阵相加,得到所述第一增强图像特征。
5.根据权利要求2所述的图像识别方法,其中,所述对所述融合图像特征在像素上进行增强,以获取第二增强图像特征,包括:
将所述第二降维特征矩阵和所述第一降维特征矩阵相乘,获取所述像素对应的第二权重矩阵;
基于所述融合图像特征和所述第二权重矩阵,获取所述第二增强图像特征。
6.根据权利要求5所述的图像识别方法,其中,所述基于所述融合图像特征和所述第二权重矩阵,获取所述第二增强图像特征,包括:
对所述融合图像特征进行卷积操作,获取第三中间特征矩阵;
将所述第二权重矩阵与所述第三中间特征矩阵相乘,得到第四中间特征矩阵;
将所述第三中间特征矩阵和所述第四中间特征矩阵相加,得到所述第二增强图像特征。
7.根据权利要求2所述的图像识别方法,其中,所述融合图像特征包括特征提取通道、特征长度和特征宽度,则所述对所述融合图像特征进行降维处理,得到第一降维特征矩阵和第二降维特征矩阵,包括:
将所述融合图像特征中的特征长度和特征宽度两个维度进行融合,得到所述第一降维特征矩阵和所述第二降维特征矩阵。
8.根据权利要求1-7任一项所述的图像识别方法,其中,所述基于所述第一增强图像特征和所述第二增强图像特征,获取所述待识别图像的纹理类型,包括:
对所述第一增强图像特征和所述第二增强图像特征进行加权,得到所述目标图像特征;
基于所述目标图像特征,识别所述待识别图像的纹理类型。
9.一种图像识别装置,包括:
特征提取模块,用于获取待识别图像,并提取所述待识别图像的图像特征;
滤波融合模块,用于基于多个方向滤波器对所述图像特征进行局部特征提取,获取多个方向上的局部图像特征,并对所述局部图像特征进行融合,得到融合图像特征;
第一增强模块,用于对所述融合图像特征在特征提取通道上进行增强,以获取第一增强图像特征;
第二增强模块,用于对所述融合图像特征在像素上进行增强,以获取第二增强图像特征;
纹理识别模块,用于基于所述第一增强图像特征和所述第二增强图像特征,获取所述待识别图像的纹理类型。
10.根据权利要求9所述的图像识别装置,其中,还包括:
降维模块,用于对所述融合图像特征进行降维处理,得到第一降维特征矩阵和第二降维特征矩阵,其中,所述第一降维特征矩阵中的同一行的特征元素属于同一个所述特征提取通道,一个列元素对应一个像素,所述第二降维特征矩阵为所述第一降维特征矩阵的转置矩阵;
其中,所述第一降维特征矩阵和所述第二降维特征矩阵用于获取所述第一增强图像特征和所述第二增强图像特征。
11.根据权利要求10所述的图像识别装置,其中,所述第一增强模块,包括:
第一矩阵相乘单元,用于将所述第一降维特征矩阵和所述第二降维特征矩阵相乘,获取所述特征提取通道对应的第一权重矩阵;
第一获取单元,用于基于所述融合图像特征和所述第一权重矩阵,获取所述第一增强图像特征。
12.根据权利要求11所述的图像识别装置,其中,所述第一获取单元,进一步用于:
对所述融合图像特征进行卷积操作,获取第一中间特征矩阵;
将所述第一权重矩阵与所述第一中间特征矩阵相乘,得到第二中间特征矩阵;
将所述第一中间特征矩阵和所述第二中间特征矩阵相加,得到所述第一增强图像特征。
13.根据权利要求10所述的图像识别装置,其中,所述第二增强模块,包括:
第二矩阵相乘单元,用于将所述第二降维特征矩阵和所述第一降维特征矩阵相乘,获取所述像素对应的第二权重矩阵;
第二获取单元,用于基于所述融合图像特征和所述第二权重矩阵,获取所述第二增强图像特征。
14.根据权利要求13所述的图像识别装置,其中,所述第二获取单元,进一步用于:
对所述融合图像特征进行卷积操作,获取第三中间特征矩阵;
将所述第二权重矩阵与所述第三中间特征矩阵相乘,得到第四中间特征矩阵;
将所述第三中间特征矩阵和所述第四中间特征矩阵相加,得到所述第二增强图像特征。
15.根据权利要求10所述的图像识别装置,其中,所述融合图像特征包括特征提取通道、特征长度和特征宽度,则所述降维模块,进一步用于:
将所述融合图像特征中的特征长度和特征宽度两个维度进行融合,得到所述第一降维特征矩阵和所述第二降维特征矩阵。
16.根据权利要求9-15任一项所述的图像识别装置,其中,所述纹理识别模块,包括:
加权单元,用于对所述第一增强图像特征和所述第二增强图像特征进行加权,得到所述目标图像特征;
识别单元,用于基于所述目标图像特征,识别所述待识别图像的纹理类型。
17.一种电子设备,包括:
至少一个处理器,以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的图像识别方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-8中任一项所述的图像识别方法。
19.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-8中任一项所述的图像识别方法。
CN202110017609.XA 2021-01-07 2021-01-07 图像识别方法、装置、电子设备及存储介质 Active CN112819007B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110017609.XA CN112819007B (zh) 2021-01-07 2021-01-07 图像识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110017609.XA CN112819007B (zh) 2021-01-07 2021-01-07 图像识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112819007A true CN112819007A (zh) 2021-05-18
CN112819007B CN112819007B (zh) 2023-08-01

Family

ID=75868398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110017609.XA Active CN112819007B (zh) 2021-01-07 2021-01-07 图像识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112819007B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463584A (zh) * 2022-01-29 2022-05-10 北京百度网讯科技有限公司 图像处理、模型训练方法、装置、设备、存储介质及程序
CN115147801A (zh) * 2022-08-29 2022-10-04 北京百度网讯科技有限公司 车道线识别方法、装置、电子设备及存储介质
CN115205224A (zh) * 2022-06-22 2022-10-18 锋睿领创(珠海)科技有限公司 自适应特征增强的多源融合视觉检测方法、装置及介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319924A (zh) * 2018-02-07 2018-07-24 武汉理工大学 一种基于融合特征和elm算法的交通标志识别方法
CN109886933A (zh) * 2019-01-25 2019-06-14 腾讯科技(深圳)有限公司 一种医学图像识别方法、装置和存储介质
CN110321908A (zh) * 2018-03-29 2019-10-11 华为技术有限公司 图像识别方法、终端设备及计算机可读存储介质
CN110633715A (zh) * 2019-09-27 2019-12-31 深圳市商汤科技有限公司 图像处理方法、网络训练方法及装置、和电子设备
CN110674884A (zh) * 2019-09-30 2020-01-10 山东浪潮人工智能研究院有限公司 一种基于特征融合的图像识别方法
US20200043217A1 (en) * 2018-07-31 2020-02-06 Intel Corporation Enhanced immersive media pipeline for correction of artifacts and clarity of objects in computing environments
CN111310760A (zh) * 2020-02-13 2020-06-19 辽宁师范大学 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法
CN111915496A (zh) * 2019-05-08 2020-11-10 北京字节跳动网络技术有限公司 一种图像处理方法、装置及存储介质
US20200380294A1 (en) * 2019-05-30 2020-12-03 Wuyi University Method and apparatus for sar image recognition based on multi-scale features and broad learning
CN112053362A (zh) * 2020-07-14 2020-12-08 北京百度网讯科技有限公司 图像分割方法、装置、电子设备及存储介质
CN112087648A (zh) * 2019-06-14 2020-12-15 腾讯科技(深圳)有限公司 图像处理方法、装置、电子设备及存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319924A (zh) * 2018-02-07 2018-07-24 武汉理工大学 一种基于融合特征和elm算法的交通标志识别方法
CN110321908A (zh) * 2018-03-29 2019-10-11 华为技术有限公司 图像识别方法、终端设备及计算机可读存储介质
US20200043217A1 (en) * 2018-07-31 2020-02-06 Intel Corporation Enhanced immersive media pipeline for correction of artifacts and clarity of objects in computing environments
CN109886933A (zh) * 2019-01-25 2019-06-14 腾讯科技(深圳)有限公司 一种医学图像识别方法、装置和存储介质
CN111915496A (zh) * 2019-05-08 2020-11-10 北京字节跳动网络技术有限公司 一种图像处理方法、装置及存储介质
US20200380294A1 (en) * 2019-05-30 2020-12-03 Wuyi University Method and apparatus for sar image recognition based on multi-scale features and broad learning
CN112087648A (zh) * 2019-06-14 2020-12-15 腾讯科技(深圳)有限公司 图像处理方法、装置、电子设备及存储介质
CN110633715A (zh) * 2019-09-27 2019-12-31 深圳市商汤科技有限公司 图像处理方法、网络训练方法及装置、和电子设备
CN110674884A (zh) * 2019-09-30 2020-01-10 山东浪潮人工智能研究院有限公司 一种基于特征融合的图像识别方法
CN111310760A (zh) * 2020-02-13 2020-06-19 辽宁师范大学 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法
CN112053362A (zh) * 2020-07-14 2020-12-08 北京百度网讯科技有限公司 图像分割方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114463584A (zh) * 2022-01-29 2022-05-10 北京百度网讯科技有限公司 图像处理、模型训练方法、装置、设备、存储介质及程序
CN115205224A (zh) * 2022-06-22 2022-10-18 锋睿领创(珠海)科技有限公司 自适应特征增强的多源融合视觉检测方法、装置及介质
CN115205224B (zh) * 2022-06-22 2023-06-09 锋睿领创(珠海)科技有限公司 自适应特征增强的多源融合视觉检测方法、装置及介质
CN115147801A (zh) * 2022-08-29 2022-10-04 北京百度网讯科技有限公司 车道线识别方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN112819007B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN112819007B (zh) 图像识别方法、装置、电子设备及存储介质
CN112651451B (zh) 图像识别方法、装置、电子设备及存储介质
CN112949710B (zh) 一种图像的聚类方法和装置
Song et al. Integration of super-pixel segmentation and deep-learning methods for evaluating earthquake-damaged buildings using single-phase remote sensing imagery
Zamri et al. Tree species classification based on image analysis using Improved-Basic Gray Level Aura Matrix
CN111833340A (zh) 图像检测方法、装置、电子设备及存储介质
DE102019123756A1 (de) Neuronales Netzwerk zur Durchführung einer semantischen Segmentierung eines Eingabebildes
CN109615614B (zh) 基于多特征融合的眼底图像中血管的提取方法与电子设备
Nawaz et al. AI-based object detection latest trends in remote sensing, multimedia and agriculture applications
CN113177472A (zh) 动态手势识别方法、装置、设备以及存储介质
JP2023501820A (ja) フェイスパーシング方法および関連デバイス
CN112862005A (zh) 视频的分类方法、装置、电子设备和存储介质
CN114266894A (zh) 一种图像分割方法、装置、电子设备及存储介质
CN113177449A (zh) 人脸识别的方法、装置、计算机设备及存储介质
CN112529068A (zh) 一种多视图图像分类方法、系统、计算机设备和存储介质
Kaur et al. Automated Multimodal image fusion for brain tumor detection
CN113569911A (zh) 车辆识别方法、装置、电子设备及存储介质
CN115116111B (zh) 抗扰动人脸活体检测模型训练方法、装置及电子设备
CN111932530A (zh) 三维对象检测方法、装置、设备和可读存储介质
CN116363516A (zh) 基于边缘辅助自适应的遥感图像变化检测方法
CN108764289B (zh) 一种基于卷积神经网络的ui异常图片分类方法及系统
Nair et al. A modular architecture for high resolution image dehazing
CN113963011A (zh) 图像识别方法、装置、电子设备及存储介质
CN113516003A (zh) 一种应用于智慧安防的基于识别模型的识别方法及装置
CN112560848A (zh) 兴趣点poi预训练模型的训练方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant