CN116912888A - 对象识别方法、装置、电子设备及存储介质 - Google Patents

对象识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116912888A
CN116912888A CN202311168671.4A CN202311168671A CN116912888A CN 116912888 A CN116912888 A CN 116912888A CN 202311168671 A CN202311168671 A CN 202311168671A CN 116912888 A CN116912888 A CN 116912888A
Authority
CN
China
Prior art keywords
feature
layer
convolution
sub
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311168671.4A
Other languages
English (en)
Inventor
蒋召
周靖宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xumi Yuntu Space Technology Co Ltd
Original Assignee
Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xumi Yuntu Space Technology Co Ltd filed Critical Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority to CN202311168671.4A priority Critical patent/CN116912888A/zh
Publication of CN116912888A publication Critical patent/CN116912888A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • G06V10/16Image acquisition using multiple overlapping images; Image stitching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及图像处理技术领域,提供了一种对象识别方法、装置、电子设备及存储介质。该方法包括:获取输入图像;使用第一卷积层提取输入图像的第一特征;对第一特征进行通道切分,得到第一子特征和第二子特征;在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征;将第一分组特征和第二分组特征进行特征拼接得到第二特征;使用第二卷积层对第二特征进行特征变换,得到第三特征;重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征;使用全连接层对N组第三特征进行分类,得到待识别的对象。该方法能提高识别速度。

Description

对象识别方法、装置、电子设备及存储介质
技术领域
本申请涉及图像处理技术领域,尤其涉及一种对象识别方法、装置、电子设备及存储介质。
背景技术
现有行人重识别算法因为其特征提取网络相对较大,因此其会影响整体的模型推理时间,从而降低了该任务的响应速度。相关技术中,通常采用直接更换轻量级模块进行处理的方式,来解决行人重识别任务中推理时间过长的问题。然而,但是这种直接更换轻量级模块的方法会为算法整体带来较大的性能损伤。
发明内容
有鉴于此,本申请实施例提供了一种对象识别方法、装置、电子设备及存储介质,以解决现有技术中行人重识别算法中特征提取网络推理时间较长的问题。
本申请实施例的第一方面,提供了一种对象识别方法,包括:
获取输入图像;
使用第一卷积层提取输入图像的第一特征;
对第一特征进行通道切分,得到第一子特征和第二子特征;
在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征;
将第一分组特征和第二分组特征进行特征拼接,得到第二特征;
使用第二卷积层对第二特征进行特征变换,得到第三特征;
重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征,其中,N为正整数;
使用全连接层对N组第三特征进行分类,得到待识别的对象。
本申请实施例的第二方面,提供了一种图像特征提取装置,包括:
获取模块,被配置为获取输入图像;
提取模块,被配置为使用第一卷积层提取输入图像的第一特征;
切分模块,被配置为对第一特征进行通道切分,得到第一子特征和第二子特征;
处理模块,被配置为在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征;
拼接模块,被配置为将第一分组特征和第二分组特征进行特征拼接,得到第二特征;
提取模块还被配置为使用第二卷积层对第二特征进行特征变换,得到第三特征;
迭代模块,被配置为重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征,其中,N为正整数;
分类模块,被配置为使用全连接层对N组第三特征进行分类,得到待识别的对象。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例通过对提取的图像特征进行通道切分,并将切分后的特征在两个分支分别进行分组卷积和逐层卷积处理,将处理后的特征拼接并再次经卷积层进行特征变换后,经全连接层分类得到待识别的对象,能够在保证精度的同时,提升了特征提取网络的推理速度,提高了对象识别效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例的应用场景的场景示意图。
图2是本申请实施例提供的一种对象识别方法的流程示意图。
图3是本申请实施例提供的在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征的方法的流程示意图。
图4是本申请实施例提供的在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征的方法的流程示意图。
图5是本申请实施例提供的将第一分组特征和第二分组特征进行特征拼接得到第二特征的方法的流程示意图。
图6是本申请实施例提供的分组卷积模块的示意图。
图7是本申请实施例提供的一种对象识别方法的流程示意图。
图8是本申请实施例提供的对象识别方法的框架示意图。
图9是本申请实施例提供的一种对象识别装置的示意图。
图10是本申请实施例提供的电子设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
下面将结合附图详细说明根据本申请实施例的一种对象识别和装置。
图1是本申请实施例的应用场景的场景示意图。该应用场景可以包括终端设备1、2和3、服务器4以及网络5。
终端设备1、2和3可以是硬件,也可以是软件。当终端设备1、2和3为硬件时,其可以是具有显示屏且支持与服务器4通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备1、2和3为软件时,其可以安装在如上所述的电子设备中。终端设备1、2和3可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本申请实施例对此不作限制。进一步地,终端设备1、2和3上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
服务器4可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器4可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本申请实施例对此不作限制。
需要说明的是,服务器4可以是硬件,也可以是软件。当服务器4为硬件时,其可以是为终端设备1、2和3提供各种服务的各种电子设备。当服务器4为软件时,其可以是为终端设备1、2和3提供各种服务的多个软件或软件模块,也可以是为终端设备1、2和3提供各种服务的单个软件或软件模块,本申请实施例对此不作限制。
网络5可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near FieldCommunication,NFC)、红外(Infrared)等,本申请实施例对此不作限制。
用户可以通过终端设备1、2和3经由网络5与服务器4建立通信连接,以接收或发送信息等。具体地,用户可以通过终端设备获取待识别的目标原图,并将该目标原图传输至服务器进行识别。服务器中可以配置特征提取网络等软件。服务器可以从终端设备或者服务器自身的数据库中获取用于训练特征提取网络的样本图像,基于样本图像训练得到高效率的特征提取网络,进而基于训练好的特征提取网络实现对象识别。
需要说明的是,终端设备1、2和3、服务器4以及网络5的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本申请实施例对此不作限制。
上文提及,相关技术中,通常采用直接更换轻量级模块进行处理的方式,来解决行人重识别任务中推理时间过长的问题。然而,但是这种直接更换轻量级模块的方法会为算法整体带来较大的性能损伤。
鉴于此,本申请实施例提供了一种对象识别方法,通过对提取的图像特征进行通道切分,并将切分后的特征在两个分支分别进行分组卷积和逐层卷积处理,将处理后的特征拼接并再次经卷积层进行特征变换后,经全连接层分类得到待识别的对象,能够在保证精度的同时,提升了特征提取网络的推理速度,提高了对象识别效率。
图2是本申请实施例提供的一种对象识别方法的流程示意图。图2的对象识别方法可以由图1的终端设备或服务器执行。如图2所示,该对象识别方法包括如下步骤:
在步骤S201中,获取输入图像。
在步骤S202中,使用第一卷积层提取输入图像的第一特征。
在步骤S203中,对第一特征进行通道切分,得到第一子特征和第二子特征。
在步骤S204中,在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征。
在步骤S205中,将第一分组特征和第二分组特征进行特征拼接,得到第二特征。
在步骤S206中,使用第二卷积层对第二特征进行特征变换,得到第三特征。
在步骤S207中,重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征。
其中,N为正整数。
在步骤S208中,使用全连接层对N组第三特征进行分类,得到待识别的对象。
本申请实施例中,该对象识别方法可用于识别图像中的目标对象,例如进行行人重识别。
本申请实施例中,可以首先获取输入图像,然后使用第一卷积层提取输入图像的第一特征。随后,对第一特征进行通道切分,得到第一子特征和第二子特征。通道切分可以采用通道均分的方式。例如。若第一特征包含的特征数为16乘16乘100,则采用通道均分的方式进行通道切分,可以得到分别包含16乘16乘50个特征的第一子特征和第二子特征。通过对特征进行通道切分,使得原来需要处理完整输入特征的计算分支切分为两个分支,分别处理一半的输入特征,从而提高了计算速度。
本申请实施例中,可以在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征。通过在各分支对特征进行分组卷积和逐层卷积,进一步降低了计算量。
本申请实施例中,可以将第一分组特征和第二分组特征进行特征拼接,得到第二特征,然后使用第二卷积层对第二特征进行特征变换,得到第三特征。其中,使用第二卷积层对第二特征进行特征变换,可以增强在不同通道,即不同分支处理得到的第一分组特征和第二分组特征的信息交互,进而增强两个分支处理后的特征图间的信息交互,提高计算精度。
本申请实施例中,可以重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征。其中,N为正整数。采用这种方式,可以提取到图像中更加高层的语义特征。N的数值越大,提取的高层语义特征越丰富,但计算开销和时间开销也将增加。在本申请的一些实施方式中,N可以为3。
本申请实施例中,可以使用全连接层对N组第三特征进行分类,得到待识别的对象。
根据本申请实施例提供的技术方案,通过对提取的图像特征进行通道切分,并将切分后的特征在两个分支分别进行分组卷积和逐层卷积处理,将处理后的特征拼接并再次经卷积层进行特征变换后,经全连接层分类得到待识别的对象,能够在保证精度的同时,提升了特征提取网络的推理速度,提高了对象识别效率。
图3是本申请实施例提供的在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征的方法的流程示意图。如图3所示,该方法包括如下步骤:
在步骤S301中,在第一分支逐层计算第一子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第一子特征的第一中间子特征。
在步骤S302中,计算第一中间子特征与第二卷积核的卷积,得到第一分组特征。
其中,第一卷积核为3乘3的卷积核,第二卷积核为1乘1的卷积核。
本申请实施例中,可以首先在第一分支逐层计算第一子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第一子特征的第一中间子特征。然后计算第一中间子特征与第二卷积核的卷积,得到第一分组特征。
图4是本申请实施例提供的在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征的方法的流程示意图。如图4所示,该方法包括如下步骤:
在步骤S401中,在第二分支计算第二子特征与第二卷积核的卷积,得到第二子特征的第二中间子特征。
在步骤S402中,逐层计算第二中间子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第二子特征的第三中间子特征。
在步骤S403中,计算第三中间子特征与第二卷积核的卷积,得到第二分组特征。
其中,第一卷积核为3乘3的卷积核,第二卷积核为1乘1的卷积核。
本申请实施例中,可以首先在第二分支计算第二子特征与第二卷积核的卷积,得到第二子特征的第二中间子特征。然后逐层计算第二中间子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第二子特征的第三中间子特征。最后计算第三中间子特征与第二卷积核的卷积,得到第二分组特征。
图5是本申请实施例提供的将第一分组特征和第二分组特征进行特征拼接得到第二特征的方法的流程示意图。如图5所示,该方法包括如下步骤:
在步骤S501中,将第一分组特征和第二分组特征按照通道进行特征拼接,得到拼接特征。
在步骤S502中,对拼接特征进行混洗处理,得到第二特征。
本申请实施例中,在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征后,可以将第一分组特征和第二分组特征按照通道进行特征拼接,得到拼接特征。进一步的,将所述第一分组特征和所述第二分组特征进行特征拼接,即可得到第二特征。
图6是本申请实施例提供的分组卷积模块的示意图。如图6所示,该分组卷积模块在接收到输入特征后,首先将输入特征按照通道进行切分,然后将切分后的第一子特征送入第一分支,该第一分支首先进行3乘3的逐层卷积计算,然后将计算结果送入1乘1的卷积层,进行跨通道信息融合。具体的,3乘3逐层卷积的计算方式是每一层特征和一个卷积核进行计算,这样卷积计算过程中每个卷积核只和一层的特征进行了计算,没有跨通道信息交互。1乘1卷积层也就是常规的卷积层,其计算过程中每个卷积核都会和所有层的特征进行计算,所以可以实现跨通道信息交互。
同时,该分组卷积模块还将切分后的第二子特征送入第二分支,该第二分支首先用1乘1的卷积层将通道降低,然后进行3乘3逐层卷积,接着进行1乘1卷积变换,以进行跨通道信息融合。其中,第一分支和第二分支分别进行了不同的特征变换处理,提取了不同类型的特征,提高了特征提取精度。
最后,将第一分支和第二分支的输出结果按照通道进行拼接,并对拼接后的特征进行混洗,就完成了对第一特征的分组卷积和逐层卷积处理。
进一步的,图6所示分组卷积模块中的每个卷积层后还可以设置一个参数修正线性单元PReLU激活函数。即,可以使用参数修正线性单元PReLU激活函数对第一中间子特征、第一分组特征、第二中间子特征、第三中间子特征和/或第二分组特征进行激活处理。也就是说,在图6中的每个3乘3逐层卷积和每个1乘1卷积层后,都可以设置一个PReLU激活函数来进行激活。与传统的ReLU激活函数不同,由于PReLU激活函数具有学习参数,因此其可以改进ReLU负半轴激活为0的问题。
图7是本申请实施例提供的一种对象识别方法的流程示意图。图7所示实施例中步骤S701至步骤S707与图2所示实施例中的步骤S201至步骤S207基本相同,此处不再赘述。如图7所示,该方法还包括如下步骤:
在步骤S708中,使用广义均值池化层对N组第三特征进行池化处理。
在步骤S709中,使用全连接层对池化处理后的第三特征进行分类,得到待识别的对象。
本申请实施例中,在使用全连接层度特征进行分类之前,还可以使用广义均值(Generalized Mean Pooling,Gem)池化层对N组第三特征进行池化处理。其中,GEM池化的计算公式为:
其中,X为特征图,xi为特征图中的第i个元素,p为超参数,其为可学习参数或者固定参数。
图8是本申请实施例提供的对象识别方法的框架示意图,如图8所示,该方法首先可以通过卷积层提取输入图片的特征。然后将特征送入分组卷积模块,该模块会对特征进行变换,其通过分组卷积和逐层卷积降低了计算量。接下来,将上一步输出的特征通过卷积层进行变换。重复执行上两个步骤,重复的次数可以为3。接着将经过中间模块处理的特征送入全连接层,并计算输出。在模型训练阶段可以根据输出和标签计算损失,以根据损失反向更新网络参数。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图9是本申请实施例提供的一种对象识别装置的示意图。如图9所示,该对象识别装置包括:
获取模块901,被配置为获取输入图像;
提取模块902,被配置为使用第一卷积层提取输入图像的第一特征;
切分模块903,被配置为对第一特征进行通道切分,得到第一子特征和第二子特征;
处理模块904,被配置为在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征;
拼接模块905,被配置为将第一分组特征和第二分组特征进行特征拼接,得到第二特征;
提取模块902还被配置为使用第二卷积层对第二特征进行特征变换,得到第三特征;
迭代模块906,被配置为重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征,其中,N为正整数;
分类模块907,被配置为使用全连接层对N组第三特征进行分类,得到待识别的对象。
根据本申请实施例提供的技术方案,通过对提取的图像特征进行通道切分,并将切分后的特征在两个分支分别进行分组卷积和逐层卷积处理,将处理后的特征拼接并再次经卷积层进行特征变换后,经全连接层分类得到待识别的对象,能够在保证精度的同时,提升了特征提取网络的推理速度,提高了对象识别效率。
本申请实施例中,在第一分支对第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,包括:在第一分支逐层计算第一子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第一子特征的第一中间子特征;计算第一中间子特征与第二卷积核的卷积,得到第一分组特征;其中,第一卷积核为3乘3的卷积核,第二卷积核为1乘1的卷积核。
本申请实施例中,在第二分支对第二子特征进行分组卷积和逐层卷积处理得到第二分组特征,包括:在第二分支计算第二子特征与第二卷积核的卷积,得到第二子特征的第二中间子特征;逐层计算第二中间子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第二子特征的第三中间子特征;计算第三中间子特征与第二卷积核的卷积,得到第二分组特征;其中,第一卷积核为3乘3的卷积核,第二卷积核为1乘1的卷积核。
本申请实施例中,还包括:使用参数修正线性单元PReLU激活函数对第一分组特征、第二中间子特征和/或第二分组特征进行激活处理。
本申请实施例中,将第一分组特征和第二分组特征进行特征拼接,得到第二特征,包括:将第一分组特征和第二分组特征按照通道进行特征拼接,得到拼接特征;对拼接特征进行混洗处理,得到第二特征。
本申请实施例中,还包括:使用广义均值池化层对N组第三特征进行池化处理;使用全连接层对池化处理后的第三特征进行分类,得到待识别的对象。
本申请实施例中,通道切分包括通道均分。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图10是本申请实施例提供的电子设备的示意图。如图10所示,该实施例的电子设备10包括:处理器1001、存储器1002以及存储在该存储器1002中并且可在处理器1001上运行的计算机程序1003。处理器1001执行计算机程序1003时实现上述各个方法实施例中的步骤。或者,处理器1001执行计算机程序1003时实现上述各装置实施例中各模块/单元的功能。
电子设备10可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备10可以包括但不仅限于处理器1001和存储器1002。本领域技术人员可以理解,图10仅仅是电子设备10的示例,并不构成对电子设备10的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器1001可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器1002可以是电子设备的内部存储单元,例如,电子设备10的硬盘或内存。存储器1002也可以是电子设备10的外部存储设备,例如,电子设备10上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。存储器1002还可以既包括电子设备10的内部存储单元也包括外部存储设备。存储器1002用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种对象识别方法,其特征在于,包括:
获取输入图像;
使用第一卷积层提取输入图像的第一特征;
对所述第一特征进行通道切分,得到第一子特征和第二子特征;
在第一分支对所述第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对所述第二子特征进行分组卷积和逐层卷积处理得到第二分组特征;
将所述第一分组特征和所述第二分组特征进行特征拼接,得到第二特征;
使用第二卷积层对所述第二特征进行特征变换,得到第三特征;
重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征,其中,N为正整数;
使用全连接层对所述N组第三特征进行分类,得到待识别的对象。
2.根据权利要求1所述的方法,其特征在于,所述在第一分支对所述第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,包括:
在所述第一分支逐层计算所述第一子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第一子特征的第一中间子特征;
计算所述第一中间子特征与第二卷积核的卷积,得到所述第一分组特征;
其中,所述第一卷积核为3乘3的卷积核,所述第二卷积核为1乘1的卷积核。
3.根据权利要求1所述的方法,其特征在于,所述在第二分支对所述第二子特征进行分组卷积和逐层卷积处理得到第二分组特征,包括:
在所述第二分支计算所述第二子特征与第二卷积核的卷积,得到第二子特征的第二中间子特征;
逐层计算所述第二中间子特征中每一层特征与第一卷积核中每个卷积核的卷积值,得到第二子特征的第三中间子特征;
计算所述第三中间子特征与第二卷积核的卷积,得到所述第二分组特征;
其中,所述第一卷积核为3乘3的卷积核,所述第二卷积核为1乘1的卷积核。
4.根据权利要求2或3所述的方法,其特征在于,所述方法还包括:
使用参数修正线性单元PReLU激活函数对所述第一中间子特征、所述第一分组特征、所述第二中间子特征、所述第三中间子特征和/或第二分组特征进行激活处理。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述将所述第一分组特征和所述第二分组特征进行特征拼接,得到第二特征,包括:
将所述第一分组特征和所述第二分组特征按照通道进行特征拼接,得到拼接特征;
对所述拼接特征进行混洗处理,得到所述第二特征。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
使用广义均值池化层对所述N组第三特征进行池化处理;
使用全连接层对所述池化处理后的第三特征进行分类,得到待识别的对象。
7.根据权利要求1所述的方法,其特征在于,所述通道切分包括通道均分。
8.一种对象识别装置,其特征在于,包括:
获取模块,被配置为获取输入图像;
提取模块,被配置为使用第一卷积层提取输入图像的第一特征;
切分模块,被配置为对所述第一特征进行通道切分,得到第一子特征和第二子特征;
处理模块,被配置为在第一分支对所述第一子特征进行分组卷积和逐层卷积处理得到第一分组特征,在第二分支对所述第二子特征进行分组卷积和逐层卷积处理得到第二分组特征;
拼接模块,被配置为将所述第一分组特征和所述第二分组特征进行特征拼接,得到第二特征;
所述提取模块还被配置为使用第二卷积层对所述第二特征进行特征变换,得到第三特征;
迭代模块,被配置为重复执行N次上述通道切分、分组卷积、逐层卷积、特征拼接和特征提取的操作,得到N组第三特征,其中,N为正整数;
分类模块,被配置为使用全连接层对所述N组第三特征进行分类,得到待识别的对象。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202311168671.4A 2023-09-12 2023-09-12 对象识别方法、装置、电子设备及存储介质 Pending CN116912888A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311168671.4A CN116912888A (zh) 2023-09-12 2023-09-12 对象识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311168671.4A CN116912888A (zh) 2023-09-12 2023-09-12 对象识别方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116912888A true CN116912888A (zh) 2023-10-20

Family

ID=88356953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311168671.4A Pending CN116912888A (zh) 2023-09-12 2023-09-12 对象识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116912888A (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764336A (zh) * 2018-05-28 2018-11-06 北京陌上花科技有限公司 用于图像识别的深度学习方法及装置、客户端、服务器
CN110647893A (zh) * 2019-09-20 2020-01-03 北京地平线机器人技术研发有限公司 目标对象识别方法、装置、存储介质和设备
WO2022027917A1 (zh) * 2020-08-05 2022-02-10 深圳市优必选科技股份有限公司 图像处理方法、装置、系统、电子设备及可读存储介质
CN115439848A (zh) * 2022-10-19 2022-12-06 中国农业银行股份有限公司 一种场景识别方法、装置、设备和存储介质
CN116033159A (zh) * 2022-12-08 2023-04-28 浙江大华技术股份有限公司 特征处理方法、图像编码方法及装置
CN116593980A (zh) * 2023-04-20 2023-08-15 中国人民解放军93209部队 雷达目标识别模型训练方法、雷达目标识别方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108764336A (zh) * 2018-05-28 2018-11-06 北京陌上花科技有限公司 用于图像识别的深度学习方法及装置、客户端、服务器
CN110647893A (zh) * 2019-09-20 2020-01-03 北京地平线机器人技术研发有限公司 目标对象识别方法、装置、存储介质和设备
WO2022027917A1 (zh) * 2020-08-05 2022-02-10 深圳市优必选科技股份有限公司 图像处理方法、装置、系统、电子设备及可读存储介质
CN115439848A (zh) * 2022-10-19 2022-12-06 中国农业银行股份有限公司 一种场景识别方法、装置、设备和存储介质
CN116033159A (zh) * 2022-12-08 2023-04-28 浙江大华技术股份有限公司 特征处理方法、图像编码方法及装置
CN116593980A (zh) * 2023-04-20 2023-08-15 中国人民解放军93209部队 雷达目标识别模型训练方法、雷达目标识别方法及装置

Similar Documents

Publication Publication Date Title
CN111368685B (zh) 关键点的识别方法、装置、可读介质和电子设备
CN110321958B (zh) 神经网络模型的训练方法、视频相似度确定方法
EP3893125A1 (en) Method and apparatus for searching video segment, device, medium and computer program product
CN112364860B (zh) 字符识别模型的训练方法、装置和电子设备
CN111369427A (zh) 图像处理方法、装置、可读介质和电子设备
CN112101437A (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN112668588B (zh) 车位信息生成方法、装置、设备和计算机可读介质
CN110427915B (zh) 用于输出信息的方法和装置
CN112883968B (zh) 图像字符识别方法、装置、介质及电子设备
CN114282581A (zh) 基于数据增强的训练样本获取方法、装置和电子设备
CN112766284B (zh) 图像识别方法和装置、存储介质和电子设备
CN112883966A (zh) 图像字符识别方法、装置、介质及电子设备
CN110489955B (zh) 应用于电子设备的图像处理、装置、计算设备、介质
CN109829431B (zh) 用于生成信息的方法和装置
CN111444335B (zh) 中心词的提取方法及装置
CN113033707B (zh) 视频分类方法、装置、可读介质及电子设备
CN114333062A (zh) 基于异构双网络和特征一致性的行人重识别模型训练方法
CN113139617B (zh) 一种输电线路自主定位方法、装置及终端设备
CN116912888A (zh) 对象识别方法、装置、电子设备及存储介质
CN115359400A (zh) 视频识别方法、装置、介质及电子设备
CN111709784B (zh) 用于生成用户留存时间的方法、装置、设备和介质
CN110634155A (zh) 一种基于深度学习的目标检测方法和装置
CN114359811A (zh) 数据鉴伪方法、装置、电子设备以及存储介质
US11681920B2 (en) Method and apparatus for compressing deep learning model
CN114387588A (zh) 一种字符识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination