CN113591987B - 图像识别方法、装置、电子设备和介质 - Google Patents

图像识别方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN113591987B
CN113591987B CN202110873693.5A CN202110873693A CN113591987B CN 113591987 B CN113591987 B CN 113591987B CN 202110873693 A CN202110873693 A CN 202110873693A CN 113591987 B CN113591987 B CN 113591987B
Authority
CN
China
Prior art keywords
characteristic value
target
column
coded
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110873693.5A
Other languages
English (en)
Other versions
CN113591987A (zh
Inventor
张小虎
郑于锷
王骏
黄德臻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gemdale Corp
Original Assignee
Gemdale Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gemdale Corp filed Critical Gemdale Corp
Priority to CN202110873693.5A priority Critical patent/CN113591987B/zh
Publication of CN113591987A publication Critical patent/CN113591987A/zh
Application granted granted Critical
Publication of CN113591987B publication Critical patent/CN113591987B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种图像识别方法、装置、电子设备和介质。该方法包括:获取待识别图像的特征矩阵;在特征矩阵中选取一个特征值作为目标特征值,并选取与目标特征值对应的列特征值和行特征值,基于目标特征值、列特征值和行特征值对目标特征值、列特征值和行特征值进行编码;在特征矩阵未被编码的特征值中重新选取一个特征值作为目标特征值,并重新选取与目标特征值对应的列特征值和行特征值,基于重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值,对重新选取的目标特征值、列特征值和行特征值进行编码,直至特征矩阵中的特征值均被编码,得到编码后的特征矩阵;将编码后的特征矩阵输入图像识别模型中,以对待识别图像识别。

Description

图像识别方法、装置、电子设备和介质
技术领域
本申请涉及图像识别领域,特别涉及一种图像识别方法、装置、电子设备和介质。
背景技术
现有技术中,在识别图像时,通常将待识别图像与多个预存图像进行比较,确定与待识别图像最相似的预存图像,通过预存图像对应的预存信息,对待识别图像进行识别。
但是,由于预存图像有限,与待识别图像最相似的预存图像与待识别图像之间的差别可能很大,导致识别不准确。
发明内容
本申请旨在提供一种图像识别方法、装置、电子设备和介质,能够解决图像识别不准确的问题。
根据本申请实施例的一个方面,提供了一种图像识别方法,包括:获取待识别图像的特征矩阵;在所述特征矩阵中选取一个特征值作为目标特征值a,并选取与所述目标特征值位于同一列且与所述目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与所述目标特征值位于同一行且与所述目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将所述目标特征值a、列特征值b和行特征值c带入公式中,以对所述目标特征值进行编码,得到编码后的目标特征值a1;将所述编码后的目标特征值a1、列特征值b和行特征值c带入公式/> 中,以对所述列特征值进行编码,得到编码后的列特征值b1;将所述编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式/> 中,以对所述行特征值进行编码,得到编码后的行特征值c1;在所述特征矩阵未被编码的特征值中重新选取一个特征值作为所述目标特征值,并重新选取与所述目标特征值对应的列特征值和行特征值,将重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值带入公式,以对重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值进行编码,直至所述特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;将所述编码后的特征矩阵输入图像识别模型中,以对所述待识别图像进行识别。
根据本申请实施例的一个方面,提供了一种图像识别装置,包括:获取模块,配置为获取待识别图像的特征矩阵;编码模块,配置为在所述特征矩阵中选取一个特征值作为目标特征值a,并选取与所述目标特征值位于同一列且与所述目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与所述目标特征值位于同一行且与所述目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将所述目标特征值a、列特征值b和行特征值c带入公式中,以对所述目标特征值进行编码,得到编码后的目标特征值a1;将所述编码后的目标特征值a1、列特征值b和行特征值c带入公式中,以对所述列特征值进行编码,得到编码后的列特征值b1;将所述编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式中,以对所述行特征值进行编码,得到编码后的行特征值c1;在所述特征矩阵未被编码的特征值中重新选取一个特征值作为所述目标特征值,并重新选取与所述目标特征值对应的列特征值和行特征值,将重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值带入公式,以对重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值进行编码,直至所述特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;识别模块,配置为将所述编码后的特征矩阵输入图像识别模型中,以对所述待识别图像进行识别。
在本申请的一个实施例中,基于前述方案,所述列特征值为所述特征矩阵中与所述目标特征值位于同一列、位于所述目标特征值右侧且与所述目标特征值相邻的特征值;所述行特征值为所述特征矩阵中与所述目标特征值位于同一行、位于所述目标特征值下方且与所述目标特征值相邻的特征值。
在本申请的一个实施例中,基于前述方案,在将所述目标特征值a、列特征值b和行特征值c带入公式之前,所述选取模块配置为:若所述列特征值为空,则将所述列特征值确定为1;若所述行特征值为空,则将所述行特征值确定为1。
在本申请的一个实施例中,基于前述方案,所述图像识别模型包括:滤波子模型,所述滤波模型的输入端用于接收所述编码后的特征矩阵,用于对所述编码后的特征矩阵进行滤波处理,得到滤波结果;线性组合子模型,所述线性组合模型的输入端连接所述滤波模型的输出端,所述线性组合模型的输入端用于接收所述滤波结果,以对所述滤波结果进行线性组合处理,得到线性组合结果,并基于所述线性组合结果对所述待识别图像进行识别。
在本申请的一个实施例中,基于前述方案,所述滤波子模型包括:第一卷积层,所述第一卷积层的输入端用于接收所述编码后的特征矩阵,所述第一卷积层中有多个通道,各个通道中的卷积核不同,所述第一卷积层用于对所述编码后的特征矩阵进行卷积计算,得到第一卷积结果;第一归一化层,所述第一归一化层的输入端连接所述第一卷积层的输出端,用于对所述第一卷积结果进行归一化处理,得到第一归一化结果;第一分类层,所述第一分类层的输入端连接所述第一归一化层的输出端,用于基于所述第一归一化结果进行分类,得到所述滤波结果。
在本申请的一个实施例中,基于前述方案,所述线性组合子模型包括:第二卷积层,所述第二卷积层为1×1卷积层,所述第二卷积层的输入端用于接收所述滤波模型的输出端,以对所述滤波结果进行线性组合处理,得到所述线性组合结果;识别层组合,所述识别层组合的输入端连接所述第二卷积层的输出端,所述识别层组合的输入端用于接收所述线性组合结果,以基于所述线性组合结果对所述待识别图像进行识别。
在本申请的一个实施例中,基于前述方案,所述识别层组合包括:第二归一化层,所述第二归一化层的输入端连接所述第二卷积层的输出端,用于对所述线性组合结果进行归一化处理,得到第二归一化结果;第二分类层,所述第二分类层的输入端连接所述第二归一化层的输出端,用于基于所述第二归一化结果进行分类,以对所述待识别图像进行识别。
根据本申请实施例的一个方面,提供了一种计算机程序存储介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行上任一项所述的方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现如上任一项所述的方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
在本申请的一些实施例所提供的技术方案中,通过获取待识别图像的特征矩阵;在特征矩阵中选取一个特征值作为目标特征值a,并选取与目标特征值位于同一列且与目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与目标特征值位于同一行且与目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将目标特征值a、列特征值b和行特征值c带入公式中,以对目标特征值进行编码,得到编码后的目标特征值a1,而该公式特征值均要求非0,公式求导后在abc小于1时a1趋近于0且求导后在abc大于1时a1趋近于无穷大,因此通过编码能够放大较大的特征值,而弱化较小的特征值,从而能够使编码后的目标特征值a1更能够体现出待识别图像的主要特征;将编码后的目标特征值a1、列特征值b和行特征值c带入公式/>中,以对列特征值进行编码,得到编码后的列特征值b1,参照上述对a1的分析可知,编码后的列特征值b1能够体现出待识别图像的主要特征;将编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式/>中,以对行特征值进行编码,得到编码后的行特征值c1,参照上述对a1的分析可知,编码后的列特征值c1能够体现出待识别图像的主要特征,在特征矩阵未被编码的特征值中重新选取一个特征值作为目标特征值,并重新选取与目标特征值对应的列特征值和行特征值,将重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值带入公式,以对重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值进行编码,直至特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;将编码后的特征矩阵输入图像识别模型中,以对待识别图像进行识别,编码后的特征矩阵是由能够体现出待识别图像的主要特征的特征值组成的,编码后的特征矩阵也能体现出待识别图像的主要特征;将编码后的特征矩阵输入图像识别模型中,以实现基于待识别图像的主要特征对待识别图像进行识别,能够更准确的识别图像。此外,由于再次选取的特征值是未被编码的特征值,而目标特征值、列特征值和行特征值均完成编码,即重新选取目标特征值的范围为特征矩阵中除了目标特征值、列特征值和行特征值之外的特征值,即执行本申请的图像识别方法一次,能够对三个特征值进行编码,能够实现更快编码,从而加快图像识别效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构的示意图;
图2示意性示出了根据本申请的一个实施例的图像识别方法的流程图;
图3示意性示出了根据本申请的一个实施例的图像识别装置的框图;
图4是根据一示例性实施例示出的一种电子设备的硬件图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本申请实施例的技术方案的示例性系统架构100的示意图。
如图1所示,系统架构100可以包括客户端101、网络102和服务器103。网络102用以在客户端101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型,例如有线通信链路、无线通信链路等等,本申请在此不做限制。
应该理解,图1中的客户端101、网络102和服务器103的数目仅仅是示意性的。根据实现需要,可以具有任意数目的客户端101、网络102和服务器103。比如服务器103可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。客户端101可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
在本申请的一个实施例中,服务器103通过获取待识别图像的特征矩阵;在特征矩阵中选取一个特征值作为目标特征值a,并选取与目标特征值位于同一列且与目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与目标特征值位于同一行且与目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将目标特征值a、列特征值b和行特征值c带入公式中,以对目标特征值进行编码,得到编码后的目标特征值a1,而该公式特征值均要求非0,公式求导后在abc小于1时a1趋近于0且求导后在abc大于1时a1趋近于无穷大,因此通过编码能够放大较大的特征值,而弱化较小的特征值,从而能够使编码后的目标特征值a1更能够体现出待识别图像的主要特征;将编码后的目标特征值a1、列特征值b和行特征值c带入公式/>中,以对列特征值进行编码,得到编码后的列特征值b1,参照上述对a1的分析可知,编码后的列特征值b1能够体现出待识别图像的主要特征;将编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式/>中,以对行特征值进行编码,得到编码后的行特征值c1,参照上述对a1的分析可知,编码后的列特征值c1能够体现出待识别图像的主要特征,在特征矩阵未被编码的特征值中重新选取一个特征值作为目标特征值,并重新选取与目标特征值对应的列特征值和行特征值,将重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值带入公式,以对重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值进行编码,直至特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;将编码后的特征矩阵输入图像识别模型中,以对待识别图像进行识别,编码后的特征矩阵是由能够体现出待识别图像的主要特征的特征值组成的,编码后的特征矩阵也能体现出待识别图像的主要特征;将编码后的特征矩阵输入图像识别模型中,以实现基于待识别图像的主要特征对待识别图像进行识别,能够更准确的识别图像。此外,由于再次选取的特征值是未被编码的特征值,而目标特征值、列特征值和行特征值均完成编码,即重新选取目标特征值的范围为特征矩阵中除了目标特征值、列特征值和行特征值之外的特征值,即执行本申请的图像识别方法一次,能够对三个特征值进行编码,能够实现更快编码,从而加快图像识别效率。
需要说明的是,本申请实施例所提供的图像识别方法一般由服务器103执行,相应地,图像识别装置一般设置于服务器103中。但是,在本申请的其它实施例中,客户端101也可以与服务器103具有相似的功能,从而执行本申请实施例所提供的图像识别方法。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图2示意性示出了根据本申请的一个实施例的图像识别方法的流程图,该图像识别方法的执行主体可以是服务器,比如可以是图1中所示的服务器103。
参照图2所示,该图像识别方法至少包括步骤S210至步骤S240,详细介绍如下:
在步骤S210中,获取待识别图像的特征矩阵。
在本申请的一个实施例中,可以待识别获取图像,对待识别图像进行特征提取,以获取待识别图像的特征矩阵。
在步骤S220中,在特征矩阵中选取一个特征值作为目标特征值a,并选取与目标特征值位于同一列且与目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与目标特征值位于同一行且与目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将目标特征值a、列特征值b和行特征值c带入公式中,以对目标特征值进行编码,得到编码后的目标特征值a1;将编码后的目标特征值a1、列特征值b和行特征值c带入公式/>中,以对列特征值进行编码,得到编码后的列特征值b1;将编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式中,以对行特征值进行编码,得到编码后的行特征值c1
在本申请的一个实施例中,列特征值可以为特征矩阵中与目标特征值位于同一列、位于目标特征值右侧且与目标特征值相邻的特征值;行特征值为特征矩阵中与目标特征值位于同一行、位于目标特征值下方且与目标特征值相邻的特征值,即第一设定距离可以等于第二设定距离等于1,第一设定距离和第二设定距离可以为其他值,在此不进行限定。
在本申请的一个实施例中,若列特征值为空,则可以将列特征值确定为1;若行特征值为空,则可以将行特征值确定为1。
在步骤S230中,在特征矩阵未被编码的特征值中重新选取一个特征值作为目标特征值,并重新选取与目标特征值对应的列特征值和行特征值,将重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值带入公式,以对重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值进行编码,直至特征矩阵中的特征值均完成编码,得到编码后的特征矩阵。
在步骤S240中,将编码后的特征矩阵输入图像识别模型中,以对待识别图像进行识别。
在本申请的一个实施例中,在将编码后的特征矩阵输入图像识别模型之前,可以获取预训练的神经网络模型中各隐藏层权重;若隐藏层权重小于权重阈值,则去除隐藏层,得到图像识别模型,以使得到的图像识别模型更加简单,识别更快。
在本申请的一个实施例中,在去除隐藏层之后,可以获取神经网络模型的权重指数,权重指数由隐藏层权重按照隐藏层在神经网络模型中的顺序组合形成;将被去除的隐藏层对应的隐藏层权重,从权重指数中删除,得到去除隐藏层后的权重指数,以使得到的去除隐藏层后的权重指数位数更少,以占用服务器更少的内存。
在本申请的一个实施例中,可以获取预训练的神经网络模型中各隐藏层权重对应的权重矩阵;对各隐藏层权重对应的权重矩阵进行聚类,得到各隐藏层权重对应的聚类后的权重矩阵;基于各隐藏层权重对应的聚类后的权重矩阵,更新各隐藏层,得到图像识别模型,以对各隐藏层的权重进行压缩,使得到的图像识别模型轻量化。
在本申请的一个实施例中,可以获取隐藏层的输入神经元数量/输出神经元数量;对隐藏层对应的权重矩阵中的特征值进行聚类,得到多个特征簇;在多个特征簇中选取与输入神经元数量/输出神经元数量相同数量的特征簇;对同一特征簇中的特征值求平均值,将平均值作为聚类特征值;基于聚类特征值,确定隐藏层权重对应的聚类后的权重矩阵。
在本申请的一个实施例中,可以获取隐藏层对应与权重矩阵的梯度矩阵;对同一特征簇中的特征值对应的梯度求和,得到聚类梯度;将聚类特征值与对应聚类特征值的聚类梯度求和,得到求和结果;将求和结果进行组合,得到隐藏层权重对应的聚类后的权重矩阵。
在本申请的一个实施例中,可以随机在特征值中选取多个预备中心点;基于除了作为预备中心点之外的特征值与预备中心点之间的距离,重新在特征值中确定多个实际中心点;计算除了作为实际中心点之外的特征值与实际中心点之间的距离,得到计算结果;基于计算结果,确定与实际中心点属于同一簇的特征值,得到实际中心点对应的特征簇。
在本申请的一个实施例中,可以获取去除隐藏层之后的神经网络中各隐藏层权重对应的权重矩阵;对各隐藏层权重对应的权重矩阵进行聚类,得到各隐藏层权重对应的聚类后的权重矩阵;基于各隐藏层权重对应的聚类后的权重矩阵,更新各隐藏层,得到图像识别模型,以对各隐藏层的权重进行压缩,使得到的图像识别模型轻量化。
在本申请的一个实施例中,图像识别模型可以包括:滤波子模型,滤波模型的输入端用于接收编码后的特征矩阵,用于对编码后的特征矩阵进行滤波处理,得到滤波结果;线性组合子模型,线性组合模型的输入端连接滤波模型的输出端,线性组合模型的输入端用于接收滤波结果,以对滤波结果进行线性组合处理,得到线性组合结果,并基于线性组合结果对待识别图像进行识别。
在本申请的一个实施例中,滤波子模型可以包括:第一卷积层,第一卷积层的输入端用于接收编码后的特征矩阵,第一卷积层中有多个通道,各个通道中的卷积核不同,第一卷积层用于对编码后的特征矩阵进行卷积计算,得到第一卷积结果;第一归一化层,第一归一化层的输入端连接第一卷积层的输出端,用于对第一卷积结果进行归一化处理,得到第一归一化结果;第一分类层,第一分类层的输入端连接第一归一化层的输出端,用于基于第一归一化结果进行分类,得到滤波结果。
在本申请的一个实施例中,线性组合子模型可以包括:线性组合子模型包括:第二卷积层,第二卷积层为1×1卷积层,第二卷积层的输入端用于接收滤波模型的输出端,以对滤波结果进行线性组合处理,得到线性组合结果;识别层组合,识别层组合的输入端连接第二卷积层的输出端,识别层组合的输入端用于接收线性组合结果,以基于线性组合结果对待识别图像进行识别。
在本申请的一个实施例中,识别层组合可以包括:第二归一化层,第二归一化层的输入端连接第二卷积层的输出端,用于对线性组合结果进行归一化处理,得到第二归一化结果;第二分类层,第二分类层的输入端连接第二归一化层的输出端,用于基于第二归一化结果进行分类,以对待识别图像进行识别。
在图2的实施例中,通过获取待识别图像的特征矩阵;在特征矩阵中选取一个特征值作为目标特征值a,并选取与目标特征值位于同一列且与目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与目标特征值位于同一行且与目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将目标特征值a、列特征值b和行特征值c带入公式 中,以对目标特征值进行编码,得到编码后的目标特征值a1,而该公式特征值均要求非0,公式求导后在abc小于1时a1趋近于0且求导后在abc大于1时a1趋近于无穷大,因此通过编码能够放大较大的特征值,而弱化较小的特征值,从而能够使编码后的目标特征值a1更能够体现出待识别图像的主要特征;将编码后的目标特征值a1、列特征值b和行特征值c带入公式/>中,以对列特征值进行编码,得到编码后的列特征值b1,参照上述对a1的分析可知,编码后的列特征值b1能够体现出待识别图像的主要特征;将编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式/>中,以对行特征值进行编码,得到编码后的行特征值c1,参照上述对a1的分析可知,编码后的列特征值c1能够体现出待识别图像的主要特征,在特征矩阵未被编码的特征值中重新选取一个特征值作为目标特征值,并重新选取与目标特征值对应的列特征值和行特征值,将重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值带入公式,以对重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值进行编码,直至特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;将编码后的特征矩阵输入图像识别模型中,以对待识别图像进行识别,编码后的特征矩阵是由能够体现出待识别图像的主要特征的特征值组成的,编码后的特征矩阵也能体现出待识别图像的主要特征;将编码后的特征矩阵输入图像识别模型中,以实现基于待识别图像的主要特征对待识别图像进行识别,能够更准确的识别图像。此外,由于再次选取的特征值是未被编码的特征值,而目标特征值、列特征值和行特征值均完成编码,即重新选取目标特征值的范围为特征矩阵中除了目标特征值、列特征值和行特征值之外的特征值,即执行本申请的图像识别方法一次,能够对三个特征值进行编码,能够实现更快编码,从而加快图像识别效率。
在本申请的一个实施例中,可以将本申请的图像识别方法应用于计算机辅助设计(Computer Aided Design,CAD)审图,能够大大提高CAD审图的速度,提前预判CAD图像中建筑构件之间的相互冲突和可视化沟通,提升了项目工作人员之间的协作能力。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的图像识别方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的图像识别方法的实施例。
图3示意性示出了根据本申请的一个实施例的图像识别装置的框图。
参照图3所示,根据本申请的一个实施例的图像识别装置300,包括获取模块301、编码模块302和识别模块303。
根据本申请实施例的一个方面,基于前述方案,获取模块301配置为获取待识别图像的特征矩阵;编码模块302配置为在特征矩阵中选取一个特征值作为目标特征值a,并选取与目标特征值位于同一列且与目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与目标特征值位于同一行且与目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将目标特征值a、列特征值b和行特征值c带入公式中,以对目标特征值进行编码,得到编码后的目标特征值a1;将编码后的目标特征值a1、列特征值b和行特征值c带入公式/>中,以对列特征值进行编码,得到编码后的列特征值b1;将编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式/>中,以对行特征值进行编码,得到编码后的行特征值c1;在特征矩阵未被编码的特征值中重新选取一个特征值作为目标特征值,并重新选取与目标特征值对应的列特征值和行特征值,将重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值带入公式,以对重新选取的目标特征值、重新选取的与目标特征值对应的列特征值和行特征值进行编码,直至特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;识别模块303配置为将编码后的特征矩阵输入图像识别模型中,以对待识别图像进行识别。
在本申请的一个实施例中,基于前述方案,列特征值为特征矩阵中与目标特征值位于同一列、位于目标特征值右侧且与目标特征值相邻的特征值;行特征值为特征矩阵中与目标特征值位于同一行、位于目标特征值下方且与目标特征值相邻的特征值。
在本申请的一个实施例中,基于前述方案,在将目标特征值a、列特征值b和行特征值c带入公式之前,编码模块302配置为:若列特征值为空,则将列特征值确定为1;若行特征值为空,则将行特征值确定为1。
在本申请的一个实施例中,基于前述方案,图像识别模型包括:滤波子模型,滤波模型的输入端用于接收编码后的特征矩阵,用于对编码后的特征矩阵进行滤波处理,得到滤波结果;线性组合子模型,线性组合模型的输入端连接滤波模型的输出端,线性组合模型的输入端用于接收滤波结果,以对滤波结果进行线性组合处理,得到线性组合结果,并基于线性组合结果对待识别图像进行识别。
在本申请的一个实施例中,基于前述方案,滤波子模型包括:第一卷积层,第一卷积层的输入端用于接收编码后的特征矩阵,第一卷积层中有多个通道,各个通道中的卷积核不同,第一卷积层用于对编码后的特征矩阵进行卷积计算,得到第一卷积结果;第一归一化层,第一归一化层的输入端连接第一卷积层的输出端,用于对第一卷积结果进行归一化处理,得到第一归一化结果;第一分类层,第一分类层的输入端连接第一归一化层的输出端,用于基于第一归一化结果进行分类,得到滤波结果。
在本申请的一个实施例中,基于前述方案,线性组合子模型包括:第二卷积层,第二卷积层为1×1卷积层,第二卷积层的输入端用于接收滤波模型的输出端,以对滤波结果进行线性组合处理,得到线性组合结果;识别层组合,识别层组合的输入端连接第二卷积层的输出端,识别层组合的输入端用于接收线性组合结果,以基于线性组合结果对待识别图像进行识别。
在本申请的一个实施例中,基于前述方案,识别层组合包括:第二归一化层,第二归一化层的输入端连接第二卷积层的输出端,用于对线性组合结果进行归一化处理,得到第二归一化结果;第二分类层,第二分类层的输入端连接第二归一化层的输出端,用于基于第二归一化结果进行分类,以对待识别图像进行识别。
所属技术领域的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图4来描述根据本申请的这种实施方式的电子设备40。图4显示的电子设备40仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,电子设备40以通用计算设备的形式表现。电子设备40的组件可以包括但不限于:上述至少一个处理单元41、上述至少一个存储单元42、连接不同系统组件(包括存储单元42和处理单元41)的总线43、显示单元44。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元41执行,使得所述处理单元41执行本说明书上述“实施例方法”部分中描述的根据本申请各种示例性实施方式的步骤。
存储单元42可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)421和/或高速缓存存储单元422,还可以进一步包括只读存储单元(ROM)423。
存储单元42还可以包括具有一组(至少一个)程序模块425的程序/实用工具424,这样的程序模块425包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线43可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备40也可以与一个或多个外部设备(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备40交互的设备通信,和/或与使得该电子设备40能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口45进行。并且,电子设备40还可以通过网络适配器46与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器46通过总线43与电子设备40的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备40使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本申请实施方式的方法。
根据本申请一个实施例,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本申请的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本申请各种示例性实施方式的步骤。
根据本申请一个实施例,用于实现上述方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本申请的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (9)

1.一种图像识别方法,其特征在于,包括:
获取待识别图像的特征矩阵;
在所述特征矩阵中选取一个特征值作为目标特征值a,并选取与所述目标特征值位于同一列且与所述目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与所述目标特征值位于同一行且与所述目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;
将所述目标特征值a、列特征值b和行特征值c带入公式 中,以对所述目标特征值进行编码,得到编码后的目标特征值a1
将所述编码后的目标特征值a1、列特征值b和行特征值c带入公式 中,以对所述列特征值进行编码,得到编码后的列特征值b1
将所述编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式中,以对所述行特征值进行编码,得到编码后的行特征值c1
在所述特征矩阵未被编码的特征值中重新选取一个特征值作为所述目标特征值,并重新选取与所述目标特征值对应的列特征值和行特征值,将重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值带入公式,以分别对重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值进行编码,直至所述特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;
将所述编码后的特征矩阵输入图像识别模型中,以对所述待识别图像进行识别;
所述图像识别模型包括:
滤波子模型,所述滤波子模型的输入端用于接收所述编码后的特征矩阵,用于对所述编码后的特征矩阵进行滤波处理,得到滤波结果;
线性组合子模型,所述线性组合子模型的输入端连接所述滤波子模型的输出端,所述线性组合子模型的输入端用于接收所述滤波结果,以对所述滤波结果进行线性组合处理,得到线性组合结果,并基于所述线性组合结果对所述待识别图像进行识别。
2.根据权利要求1所述的图像识别方法,其特征在于,
所述列特征值为所述特征矩阵中与所述目标特征值位于同一列、位于所述目标特征值下方且与所述目标特征值相邻的特征值;
所述行特征值为所述特征矩阵中与所述目标特征值位于同一行、位于所述目标特征值右侧且与所述目标特征值相邻的特征值。
3.根据权利要求1所述的图像识别方法,其特征在于,在将所述目标特征值a、列特征值b和行特征值c带入公式之前,所述方法包括:
若所述列特征值为空,则将所述列特征值确定为1;
若所述行特征值为空,则将所述行特征值确定为1。
4.根据权利要求3所述的图像识别方法,其特征在于,所述滤波子模型包括:
第一卷积层,所述第一卷积层的输入端用于接收所述编码后的特征矩阵,所述第一卷积层中有多个通道,各个通道中的卷积核不同,所述第一卷积层用于对所述编码后的特征矩阵进行卷积计算,得到第一卷积结果;
第一归一化层,所述第一归一化层的输入端连接所述第一卷积层的输出端,用于对所述第一卷积结果进行归一化处理,得到第一归一化结果;
第一分类层,所述第一分类层的输入端连接所述第一归一化层的输出端,用于基于所述第一归一化结果进行分类,得到所述滤波结果。
5.根据权利要求3所述的图像识别方法,其特征在于,所述线性组合子模型包括:
第二卷积层,所述第二卷积层为1×1卷积层,所述第二卷积层的输入端用于接收所述滤波子模型的输出端,以对所述滤波结果进行线性组合处理,得到所述线性组合结果;
识别层组合,所述识别层组合的输入端连接所述第二卷积层的输出端,所述识别层组合的输入端用于接收所述线性组合结果,以基于所述线性组合结果对所述待识别图像进行识别。
6.根据权利要求5所述的图像识别方法,其特征在于,所述识别层组合包括:
第二归一化层,所述第二归一化层的输入端连接所述第二卷积层的输出端,用于对所述线性组合结果进行归一化处理,得到第二归一化结果;
第二分类层,所述第二分类层的输入端连接所述第二归一化层的输出端,用于基于所述第二归一化结果进行分类,以对所述待识别图像进行识别。
7.一种图像识别装置,其特征在于,包括:
获取模块,配置为获取待识别图像的特征矩阵;
编码模块,配置为在所述特征矩阵中选取一个特征值作为目标特征值a,并选取与所述目标特征值位于同一列且与所述目标特征值之间的距离为第一设定距离的特征值,作为列特征值b,并选取与所述目标特征值位于同一行且与所述目标特征值之间的距离为第二设定距离的特征值,作为行特征值c;将所述目标特征值a、列特征值b和行特征值c带入公式中,以对所述目标特征值进行编码,得到编码后的目标特征值a1;将所述编码后的目标特征值a1、列特征值b和行特征值c带入公式/> 中,以对所述列特征值进行编码,得到编码后的列特征值b1;将所述编码后的目标特征值a1、编码后的列特征值b1和行特征值c带入公式/> 中,以对所述行特征值进行编码,得到编码后的行特征值c1;在所述特征矩阵未被编码的特征值中重新选取一个特征值作为所述目标特征值,并重新选取与所述目标特征值对应的列特征值和行特征值,将重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值带入公式,以分别对重新选取的所述目标特征值、重新选取的与所述目标特征值对应的列特征值和行特征值进行编码,直至所述特征矩阵中的特征值均完成编码,得到编码后的特征矩阵;
识别模块,配置为将所述编码后的特征矩阵输入图像识别模型中,以对所述待识别图像进行识别;
所述图像识别模型包括:
滤波子模型,所述滤波子模型的输入端用于接收所述编码后的特征矩阵,用于对所述编码后的特征矩阵进行滤波处理,得到滤波结果;
线性组合子模型,所述线性组合子模型的输入端连接所述滤波子模型的输出端,所述线性组合子模型的输入端用于接收所述滤波结果,以对所述滤波结果进行线性组合处理,得到线性组合结果,并基于所述线性组合结果对所述待识别图像进行识别。
8.一种电子设备,包括:处理器;存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,实现权利要求1-6中任一项所述的方法。
9.一种计算机程序存储介质,其存储有计算机程序指令,当所述计算机程序指令被计算机执行时,使计算机执行权利要求1-6中任一项所述的方法。
CN202110873693.5A 2021-07-30 2021-07-30 图像识别方法、装置、电子设备和介质 Active CN113591987B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110873693.5A CN113591987B (zh) 2021-07-30 2021-07-30 图像识别方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110873693.5A CN113591987B (zh) 2021-07-30 2021-07-30 图像识别方法、装置、电子设备和介质

Publications (2)

Publication Number Publication Date
CN113591987A CN113591987A (zh) 2021-11-02
CN113591987B true CN113591987B (zh) 2023-12-12

Family

ID=78252868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110873693.5A Active CN113591987B (zh) 2021-07-30 2021-07-30 图像识别方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN113591987B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902763A (zh) * 2019-03-19 2019-06-18 北京字节跳动网络技术有限公司 用于生成特征图的方法和装置
CN111406261A (zh) * 2017-10-05 2020-07-10 克莱米特公司 从具有大视野的图像中进行疾病识别
WO2020233010A1 (zh) * 2019-05-23 2020-11-26 平安科技(深圳)有限公司 基于可分割卷积网络的图像识别方法、装置及计算机设备
WO2021147569A1 (zh) * 2020-08-27 2021-07-29 平安科技(深圳)有限公司 基于神经网络的文字识别方法、装置及可读存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111406261A (zh) * 2017-10-05 2020-07-10 克莱米特公司 从具有大视野的图像中进行疾病识别
CN109902763A (zh) * 2019-03-19 2019-06-18 北京字节跳动网络技术有限公司 用于生成特征图的方法和装置
WO2020233010A1 (zh) * 2019-05-23 2020-11-26 平安科技(深圳)有限公司 基于可分割卷积网络的图像识别方法、装置及计算机设备
WO2021147569A1 (zh) * 2020-08-27 2021-07-29 平安科技(深圳)有限公司 基于神经网络的文字识别方法、装置及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进极限学习机的车牌字符识别方法;黄晓兰;《中国优秀硕士学位论文全文数据库 信息科技辑》(第2期);全文 *

Also Published As

Publication number Publication date
CN113591987A (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
CN110197099B (zh) 跨年龄人脸识别及其模型训练的方法和装置
WO2022105125A1 (zh) 图像分割方法、装置、计算机设备及存储介质
WO2022105117A1 (zh) 一种图像质量评价的方法、装置、计算机设备及存储介质
CN113435365B (zh) 人脸图像迁移方法及装置
CN114241459B (zh) 一种驾驶员身份验证方法、装置、计算机设备及存储介质
WO2023020214A1 (zh) 检索模型的训练和检索方法、装置、设备及介质
CN114282059A (zh) 视频检索的方法、装置、设备及存储介质
CN114332500A (zh) 图像处理模型训练方法、装置、计算机设备和存储介质
WO2021139351A1 (zh) 图像分割方法、装置、介质及电子设备
CN116978011A (zh) 一种用于智能目标识别的图像语义通信方法及系统
CN114120454A (zh) 活体检测模型的训练方法、装置、电子设备及存储介质
CN113591987B (zh) 图像识别方法、装置、电子设备和介质
CN116703659A (zh) 一种应用于工程咨询的数据处理方法、装置及电子设备
CN111582284A (zh) 用于图像识别的隐私保护方法、装置和电子设备
CN113591983B (zh) 图像识别方法和装置
CN114639143B (zh) 基于人工智能的人像归档方法、设备及存储介质
CN112307243A (zh) 用于检索图像的方法和装置
CN112633394B (zh) 一种智能用户标签确定方法、终端设备及存储介质
CN114707638A (zh) 模型训练、对象识别方法及装置、设备、介质和产品
CN113989152A (zh) 图像增强方法、装置、设备以及存储介质
CN114443864A (zh) 跨模态数据的匹配方法、装置及计算机程序产品
CN107609645B (zh) 用于训练卷积神经网络的方法和装置
CN112906652A (zh) 一种人脸图像的识别方法、装置、电子设备及存储介质
CN116721315B (zh) 活体检测模型的训练方法、装置、介质及电子设备
CN112989295A (zh) 用户识别的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant