CN116912631B - 目标识别方法、装置、电子设备及存储介质 - Google Patents

目标识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116912631B
CN116912631B CN202311168441.8A CN202311168441A CN116912631B CN 116912631 B CN116912631 B CN 116912631B CN 202311168441 A CN202311168441 A CN 202311168441A CN 116912631 B CN116912631 B CN 116912631B
Authority
CN
China
Prior art keywords
sample
target
feature extraction
original image
extraction model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311168441.8A
Other languages
English (en)
Other versions
CN116912631A (zh
Inventor
蒋召
周靖宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xumi Yuntu Space Technology Co Ltd
Original Assignee
Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xumi Yuntu Space Technology Co Ltd filed Critical Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority to CN202311168441.8A priority Critical patent/CN116912631B/zh
Publication of CN116912631A publication Critical patent/CN116912631A/zh
Application granted granted Critical
Publication of CN116912631B publication Critical patent/CN116912631B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及图像处理技术领域,提供了一种目标识别方法、装置、电子设备及存储介质。该方法包括:获取目标原图和样本原图;对样本原图进行增强处理,得到N组具有不同分辨率的样本图像;使用特征抽取模型获取样本原图与N组具有不同分辨率的样本图像的一致性损失;使用分类层获取样本原图与N组具有不同分辨率的样本图像的交叉熵损失;对一致性损失和交叉熵损失求和得到总损失,基于总损失更新特征抽取模型和分类层的模型参数;重复执行上述步骤,直至更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层;使用训练好的特征抽取模型和分类层自目标原图中识别目标。该方法能提高目标识别精度。

Description

目标识别方法、装置、电子设备及存储介质
技术领域
本申请涉及图像处理技术领域,尤其涉及一种目标识别方法、装置、电子设备及存储介质。
背景技术
随着计算机视觉技术的发展,基于分类的目标识别算法和基于度量学习的目标识别算法在通用场景下已经可以取得较好的效果。然而,当现实场景中的目标图片为低分辨率图片时,仍然可能出现域偏差的问题,即在高分辨率图片上训练的目标识别模型在低分辨率图片下表现不佳,进而无法取得理想的识别效果。
发明内容
有鉴于此,本申请实施例提供了一种目标识别方法、装置、电子设备及存储介质,以解决现有技术中当待识别目标图像与用于训练特征提取模型的样本图像的分辨率不一致时,无法准确识别出目标的问题。
本申请实施例的第一方面,提供了一种目标识别方法,包括:
获取目标原图和样本原图;
对样本原图进行增强处理,得到N组具有不同分辨率的样本图像,其中,N为正整数;
使用特征抽取模型获取样本原图与N组具有不同分辨率的样本图像的一致性损失;
使用分类层获取样本原图与N组具有不同分辨率的样本图像的交叉熵损失;
对一致性损失和交叉熵损失求和得到总损失,基于总损失更新特征抽取模型和分类层的模型参数;
重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新特征抽取模型和分类层的模型参数的步骤,直至更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层;
使用训练好的特征抽取模型和分类层自目标原图中识别目标。
本申请实施例的第二方面,提供了一种目标识别装置,包括:
获取模块,被配置为获取目标原图,并获取样本原图;
增强模块,被配置为对样本原图进行增强处理,得到N组具有不同分辨率的样本图像,其中,N为正整数;
计算模块,被配置为使用特征抽取模型获取样本原图与N组具有不同分辨率的样本图像的一致性损失;
计算模块还被配置为使用分类层获取样本原图与N组具有不同分辨率的样本图像的交叉熵损失;
更新模块,被配置为对一致性损失和交叉熵损失求和得到总损失,基于总损失更新特征抽取模型和分类层的模型参数;
迭代模块,被配置为重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新特征抽取模型和分类层的模型参数的步骤,直至更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层;
识别模块,被配置为使用训练好的特征抽取模型和分类层自目标原图中识别目标。
本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例与现有技术相比存在的有益效果是:本申请实施例通过将样本原图进行增强处理得到N组具有不同分辨率的样本图像,使用样本原图与该N组具有不同分辨率的样本图像对特征抽取模型进行训练,并使用训练好的特征抽取模型和分类层抽取目标原图中的特征,进而识别出目标,能够得到具有较高识别精度的特征抽取模型,进而能够提高目标识别精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本申请实施例的应用场景的场景示意图。
图2是本申请实施例提供的一种目标识别方法的流程示意图。
图3是本申请实施例提供的对样本原图进行增强处理得到N组具有不同分辨率的样本图像的方法的流程示意图。
图4是本申请实施例提供的基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数的方法的流程示意图。
图5是本申请实施例提供的使用训练好的特征抽取模型和分类层自目标原图中识别目标的方法的流程示意图。
图6是根据本申请实施例提供的目标识别方法的流程示意图。
图7是本申请实施例提供的一种对样本原图进行增强处理的方法的示意图。
图8是本申请实施例提供的一种目标识别装置的示意图。
图9是本申请实施例提供的电子设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
下面将结合附图详细说明根据本申请实施例的一种目标识别方法和装置。
图1是本申请实施例的应用场景的场景示意图。该应用场景可以包括终端设备1、2和3、服务器4以及网络5。
终端设备1、2和3可以是硬件,也可以是软件。当终端设备1、2和3为硬件时,其可以是具有显示屏且支持与服务器4通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备1、2和3为软件时,其可以安装在如上所述的电子设备中。终端设备1、2和3可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本申请实施例对此不作限制。进一步地,终端设备1、2和3上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
服务器4可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器4可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本申请实施例对此不作限制。
需要说明的是,服务器4可以是硬件,也可以是软件。当服务器4为硬件时,其可以是为终端设备1、2和3提供各种服务的各种电子设备。当服务器4为软件时,其可以是为终端设备1、2和3提供各种服务的多个软件或软件模块,也可以是为终端设备1、2和3提供各种服务的单个软件或软件模块,本申请实施例对此不作限制。
网络5可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near FieldCommunication,NFC)、红外(Infrared)等,本申请实施例对此不作限制。
用户可以通过终端设备1、2和3经由网络5与服务器4建立通信连接,以接收或发送信息等。具体地,用户可以通过终端设备获取待识别的目标原图,并将该目标原图传输至服务器进行识别。服务器中可以配置特征提取模型以及分类层等目标识别软件。服务器可以从终端设备或者服务器自身的数据库中获取用于训练特征提取模型和分类层的样本图像,基于样本图像训练得到与目标原图匹配的特征提取模型,进而基于训练好的特征提取模型提取目标原图中的目标特征,进而实现目标识别。
需要说明的是,终端设备1、2和3、服务器4以及网络5的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本申请实施例对此不作限制。
上文提及,当现实场景中的目标图片为低分辨率图片时,仍然可能出现域偏差的问题,即在高分辨率图片上训练的目标识别模型在低分辨率图片下表现不佳,进而无法取得理想的识别效果。
鉴于此,本申请实施例提供了一种目标识别方法,通过将样本原图进行增强处理得到N组具有不同分辨率的样本图像,使用样本原图与该N组具有不同分辨率的样本图像对特征抽取模型进行训练,并使用训练好的特征抽取模型和分类层抽取目标原图中的特征,进而识别出目标,能够得到具有较高识别精度的特征抽取模型,进而能够提高目标识别精度。
图2是本申请实施例提供的一种目标识别方法的流程示意图。图2的目标识别方法可以由图1的终端设备或服务器执行。如图2所示,该目标识别方法包括如下步骤:
在步骤S201中,获取目标原图和样本原图。
在步骤S202中,对样本原图进行增强处理,得到N组具有不同分辨率的样本图像。
其中,N为正整数。
在步骤S203中,使用特征抽取模型获取样本原图与N组具有不同分辨率的样本图像的一致性损失。
在步骤S204中,使用分类层获取样本原图与N组具有不同分辨率的样本图像的交叉熵损失。
在步骤S205中,对一致性损失和交叉熵损失求和得到总损失,基于总损失更新特征抽取模型和分类层的模型参数。
在步骤S206中,重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新特征抽取模型和分类层的模型参数的步骤,直至更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层。
在步骤S207中,使用训练好的特征抽取模型和分类层自目标原图中识别目标。
本申请实施例中,该目标识别方法可以由服务器执行,也可以由具备一定计算能力的终端设备执行。为描述方便,下文以该目标识别方法由服务器执行为例进行说明。
本申请实施例中,服务器可以首先获取目标原图和样本原图。其中,目标原图是用于进行目标识别的图像,其可以拍摄的照片、视频中的图像或者其他图像。样本原图可以是用于训练特征提取模型的样本图像,该样本图像可以是预先搜集的,保存于数据库或者其他存储单元中的图像。样本原图的数量可以是多个。
本申请实施例中,可以首先使用样本原图训练特征提取模型,然后使用训练好的特征提取模型提取目标原图中的特征,进而识别目标。
本申请实施例中,目标原图与样本原图可以具有不同的分辨率。此时,使用样本原图直接训练得到的特征提取模型来提取目标原图的特征,可能存在域偏差,进而导致目标识别精度不高。鉴于此,可以对样本原图进行增强处理,得到N组具有不同分辨率的样本图像后,再使用样本原图与该N组样本图像一起对特征提取模型进行训练,从而使得训练好的特征提取模型能够更好地处理目标原图。
其中,N组样本图像的分辨率与目标原图的分辨率的差值,小于样本原图与目标原图的分辨率的差值。也就是说,若样本原图为高分辨率图像且目标原图为低分辨率图像,则N组样本图像的分辨率均小于样本原图的分辨率且大于目标原图的分辨率。若样本原图为低分辨率图像且目标原图为高分辨率图像,则N组样本图像的分辨率均大于样本原图的分辨率且小于目标原图的分辨率。需要说明的是,上文所述的差值,均指差值的绝对值。
本申请实施例中,可以使用特征抽取模型获取样本原图与N组具有不同分辨率的样本图像的一致性损失,并使用分类层获取样本原图与N组具有不同分辨率的样本图像的交叉熵损失。对一致性损失和交叉熵损失求和得到总损失,基于总损失更新特征抽取模型和分类层的模型参数。重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新特征抽取模型和分类层的模型参数的步骤,直至更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层。
本申请实施例中,在使用样本原图和N组具有不同分辨率的样本图像训练好特征抽取模型和分类层后,可以使用训练好的特征抽取模型和分类层自目标原图中识别目标。
根据本申请实施例提供的技术方案,通过将样本原图进行增强处理得到N组具有不同分辨率的样本图像,使用样本原图与该N组具有不同分辨率的样本图像对特征抽取模型进行训练,并使用训练好的特征抽取模型和分类层抽取目标原图中的特征,进而识别出目标,能够得到具有较高识别精度的特征抽取模型,进而能够提高目标识别精度。
图3是本申请实施例提供的对样本原图进行增强处理得到N组具有不同分辨率的样本图像的方法的流程示意图。如图3所示,该方法包括如下步骤:
在步骤S301中,获取目标原图的分辨率和样本原图的分辨率。
在步骤S302中,基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数,以及每个采样倍数对应的采样图像数量。
在步骤S303中,使用N个采样倍数分别对原图进行采样,得到N组采样后的图像。
在步骤S304中,将N组采样后的图像转换为与目标原图具有相同尺寸的图像,得到N组具有不同分辨率的样本图像。
其中,N组具有不同分辨率的样本图像中,每一组目标图像的数量由采样图像数量确定。
本申请实施例中,在对样本原图进行增强处理得到N组具有不同分辨率的样本图像时,可以首先获取目标原图的分辨率和样本原图的分辨率,然后基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数,以及每个采样倍数对应的采样图像数量。也就是说,若目标原图的分辨率为R1,样本原图的分辨率为R2,可以首先基于R1和R2确定N个对样本原图进行采样的采样倍数,该N个采样倍数均为上采样倍数,或者均为下采样倍数。进一步的,针对每一个采样倍数,可以采样得到一组采样图像数量,不同的采样倍数对应的采样图像数量可以相同或者不同。
本申请实施例中,可以使用确定的N个采样倍数分别对原图进行采样,得到N组采样后的图像。进一步的,还可以将N组采样后的图像转换为与目标原图具有相同尺寸的图像,得到N组具有不同分辨率的样本图像。也就是说,通过使用N个不同的采样倍数对样本原图分别进行采样处理,然后对采样后的图像进行尺寸变换,从而可以得到N组具有不同分辨率的样本图像。其中,每组样本图像中的图像数量由该组采样倍数确定。
根据本申请实施例提供的技术方案,通过对样本图像进行增强处理,提供了丰富且准确的特征提取模型与分类层训练样本数据,提高了训练好的模型的识别精度,进而提高了目标识别精度。
图4是本申请实施例提供的基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数的方法的流程示意图。如图4所示,该方法包括如下步骤:
在步骤S401中,获取目标原图的分辨率和样本原图的分辨率的差值。
在步骤S402中,获取特征抽取模型的特征维度。
在步骤S403中,基于差值与特征维度确定N个对样本原图进行采样的采样倍数。
本申请实施例中,在基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数时,可以首先获取目标原图的分辨率和样本原图的分辨率的差值,然后获取特征抽取模型的特征维度。其中,特征抽取模型的特征维度是指特征抽取模型能够处理的最优特征数。最后,可以基于该差值与特征维度确定N个对样本原图进行采样的采样倍数。
具体的,若目标原图的分辨率为R1,样本原图的分辨率为R2,且特征抽取模型的特征维度为M,M为正整数,则可以首先基于特征维度M确定可以增强的特征数,然后基于可以增强的特征数以及样本原图中的特征数确定增加的样本数,接着计算R1与R2的差值,最后将计算得到的差值等分或者不等分为该增加的样本数份,即可确定N个对样本原图进行采样的采样倍数。
本申请实施例中,每个采样倍数对应的采样图像数量,由经采样倍数采样后的图像的分辨率与样本原图的分辨率的差值的绝对值确定。
进一步的,响应于采样倍数采样后的图像的分辨率与样本原图的分辨率的差值的绝对值越大,采样倍数对应的采样图像数量越大。响应于采样倍数采样后的图像的分辨率与样本原图的分辨率的差值的绝对值越小,采样倍数对应的采样图像数量越小。
图5是本申请实施例提供的使用训练好的特征抽取模型和分类层自目标原图中识别目标的方法的流程示意图。如图5所示,该方法包括如下步骤:
在步骤S501中,使用训练好的特征抽取模型自目标原图中获取目标特征。
在步骤S502中,使用训练好的分类层,基于目标特征识别目标。
本申请实施例中,当完成特征抽取模型和分类层的训练后,可以使用训练好的特征抽取模型自目标原图中获取目标特征,并使用训练好的分类层,基于目标特征识别目标。
本申请实施例中,特征抽取模型和分类层的模型参数包括:特征抽取模型中各图像的权重值,以及分类层中各图像的权重值。
本申请实施例中,该目标识别方法首先通过多尺度数据增强策略来构建不同难度的图片,然后通过一致性约束来保证其在特征空间的一致性,从而提升了低分辨率场景下的目标识别效果。
图6是根据本申请实施例提供的目标识别方法的流程示意图。如图6所示,首先将输入的原图即原始目标图片通过数据增强模型进行数据增强,其会输出多种不同难度的目标图片。然后通过基础特征提取模型抽取输入目标图片和多种低分辨率目标图片的特征,性能越好的特征提取模型抽取的特征越有利于目标识别任务。接着通过原图特征和多种低分辨率目标图片的特征计算一致性损失,该损失为L2损失,又称为平均平方误差(MeanSquare Error,MSE),即平均平方误差,其约束不同分辨率的相同目标图片应该在目标特征空间具有相似的特征。之后将原图特征和多种低分辨率图特征通过分类层计算输出,根据分类层的输出计算交叉熵损失。然后将一致性损失和交叉熵损失相加,计算出总损失。接下来通过损失反向更新网络参数,得到训练好的特征抽取模型和分类层。最后使用训练好的特征抽取模型和分类层对目标进行识别。
图7是本申请实施例提供的一种对样本原图进行增强处理的方法的示意图。如图7所示,假设输入的样本原图为高分辨率图像,且待识别目标原图为低分辨率图像,则可以将输入尺寸为112*112的图片下采样16倍,然后进行尺寸变换至原图尺寸112*112,得到极度难例样本,这部分数据在训练过程中梯度极小,对目标识别任务优化的贡献很小,因此只需要很少的该部分样本即可。
然后可以将输入尺寸为112*112的图片下采样8倍,然后进行尺寸变换至原图尺寸112*112,得到难例样本,这部分数据的梯度相对更大,其可以对目标识别任务的训练产生一定的影响。
最后可以将输入尺寸为112*112的图片下采样4倍,然后进行尺寸变换至原图尺寸112*112,得到半难例样本,这部分数据主要影响模型对低分辨率目标特征的学习,因此其应该具有更多样本。
采用这种方法,可以获得具有不同数量的不同分辨率样本图像,进而提高模型训练精度,提高目标识别精度。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图8是本申请实施例提供的一种目标识别装置的示意图。如图8所示,该目标识别装置包括:
获取模块801,被配置为获取目标原图,并获取样本原图;
增强模块802,被配置为对样本原图进行增强处理,得到N组具有不同分辨率的样本图像,其中,N为正整数;
计算模块803,被配置为使用特征抽取模型获取样本原图与N组具有不同分辨率的样本图像的一致性损失;
计算模块803还被配置为使用分类层获取样本原图与N组具有不同分辨率的样本图像的交叉熵损失;
更新模块804,被配置为对一致性损失和交叉熵损失求和得到总损失,基于总损失更新特征抽取模型和分类层的模型参数;
迭代模块805,被配置为重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新特征抽取模型和分类层的模型参数的步骤,直至更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层;
识别模块806,被配置为使用训练好的特征抽取模型和分类层自目标原图中识别目标。
根据本申请实施例提供的技术方案,通过将样本原图进行增强处理得到N组具有不同分辨率的样本图像,使用样本原图与该N组具有不同分辨率的样本图像对特征抽取模型进行训练,并使用训练好的特征抽取模型和分类层抽取目标原图中的特征,进而识别出目标,能够得到具有较高识别精度的特征抽取模型,进而能够提高目标识别精度。
本申请实施例中,对样本原图进行增强处理,得到N组具有不同分辨率的样本图像,包括:获取目标原图的分辨率和样本原图的分辨率;基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数,以及每个采样倍数对应的采样图像数量;使用N个采样倍数分别对原图进行采样,得到N组采样后的图像;将N组采样后的图像转换为与目标原图具有相同尺寸的图像,得到N组具有不同分辨率的样本图像;其中,N组具有不同分辨率的样本图像中,每一组目标图像的数量由采样图像数量确定。
本申请实施例中,基于目标原图的分辨率和样本原图的分辨率确定N个对样本原图进行采样的采样倍数,包括:获取目标原图的分辨率和样本原图的分辨率的差值;获取特征抽取模型的特征维度;基于差值与特征维度确定N个对样本原图进行采样的采样倍数。
本申请实施例中,每个采样倍数对应的采样图像数量,由经采样倍数采样后的图像的分辨率与样本原图的分辨率的差值的绝对值确定。
本申请实施例中,响应于采样倍数采样后的图像的分辨率与样本原图的分辨率的差值的绝对值越大,采样倍数对应的采样图像数量越大;响应于采样倍数采样后的图像的分辨率与样本原图的分辨率的差值的绝对值越小,采样倍数对应的采样图像数量越小。
本申请实施例中,使用训练好的特征抽取模型和分类层自目标原图中识别目标,包括:使用训练好的特征抽取模型自目标原图中获取目标特征;使用训练好的分类层,基于目标特征识别目标。
本申请实施例中,特征抽取模型和分类层的模型参数包括:特征抽取模型中各图像的权重值,以及分类层中各图像的权重值。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
图9是本申请实施例提供的电子设备的示意图。如图9所示,该实施例的电子设备9包括:处理器901、存储器902以及存储在该存储器902中并且可在处理器901上运行的计算机程序903。处理器901执行计算机程序903时实现上述各个方法实施例中的步骤。或者,处理器901执行计算机程序903时实现上述各装置实施例中各模块/单元的功能。
电子设备9可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备9可以包括但不仅限于处理器901和存储器902。本领域技术人员可以理解,图9仅仅是电子设备9的示例,并不构成对电子设备9的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器901可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器902可以是电子设备的内部存储单元,例如,电子设备9的硬盘或内存。存储器902也可以是电子设备9的外部存储设备,例如,电子设备9上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器902还可以既包括电子设备9的内部存储单元也包括外部存储设备。存储器902用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种目标识别方法,其特征在于,包括:
获取目标原图和样本原图;
对所述样本原图进行增强处理,得到N组具有不同分辨率的样本图像,其中,N为正整数;
使用特征抽取模型获取所述样本原图与所述N组具有不同分辨率的样本图像的一致性损失;
使用分类层获取所述样本原图与所述N组具有不同分辨率的样本图像的交叉熵损失;
对所述一致性损失和交叉熵损失求和得到总损失,基于所述总损失更新所述特征抽取模型和分类层的模型参数;
重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新所述特征抽取模型和分类层的模型参数的步骤,直至所述更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层;
使用所述训练好的特征抽取模型和分类层自所述目标原图中识别所述目标。
2.根据权利要求1所述的方法,其特征在于,所述对所述样本原图进行增强处理,得到N组具有不同分辨率的样本图像,包括:
获取所述目标原图的分辨率和所述样本原图的分辨率;
基于所述目标原图的分辨率和所述样本原图的分辨率确定N个对所述样本原图进行采样的采样倍数,以及每个采样倍数对应的采样图像数量;
使用N个采样倍数分别对所述原图进行采样,得到N组采样后的图像;
将所述N组采样后的图像转换为与所述目标原图具有相同尺寸的图像,得到所述N组具有不同分辨率的样本图像;
其中,所述N组具有不同分辨率的样本图像中,每一组目标图像的数量由所述采样图像数量确定。
3.根据权利要求2所述的方法,其特征在于,所述基于所述目标原图的分辨率和所述样本原图的分辨率确定N个对所述样本原图进行采样的采样倍数,包括:
获取所述目标原图的分辨率和所述样本原图的分辨率的差值;
获取所述特征抽取模型的特征维度;
基于所述差值与所述特征维度确定所述N个对所述样本原图进行采样的采样倍数。
4.根据权利要求2所述的方法,其特征在于,所述每个采样倍数对应的采样图像数量,由经所述采样倍数采样后的图像的分辨率与所述样本原图的分辨率的差值的绝对值确定。
5.根据权利要求4所述的方法,其特征在于,响应于所述采样倍数采样后的图像的分辨率与所述样本原图的分辨率的差值的绝对值越大,所述采样倍数对应的采样图像数量越大;
响应于所述采样倍数采样后的图像的分辨率与所述样本原图的分辨率的差值的绝对值越小,所述采样倍数对应的采样图像数量越小。
6.根据权利要求1所述的方法,其特征在于,所述使用所述训练好的特征抽取模型和分类层自所述目标原图中识别所述目标,包括:
使用所述训练好的特征抽取模型自所述目标原图中获取目标特征;
使用所述训练好的分类层,基于所述目标特征识别所述目标。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述特征抽取模型和分类层的模型参数包括:
所述特征抽取模型中各图像的权重值,以及所述分类层中各图像的权重值。
8.一种目标识别装置,其特征在于,包括:
获取模块,被配置为获取目标原图,并获取样本原图;
增强模块,被配置为对所述样本原图进行增强处理,得到N组具有不同分辨率的样本图像,其中,N为正整数;
计算模块,被配置为使用特征抽取模型获取所述样本原图与所述N组具有不同分辨率的样本图像的一致性损失;
所述计算模块还被配置为使用分类层获取所述样本原图与所述N组具有不同分辨率的样本图像的交叉熵损失;
更新模块,被配置为对所述一致性损失和交叉熵损失求和得到总损失,基于所述总损失更新所述特征抽取模型和分类层的模型参数;
迭代模块,被配置为重复执行基于更新后的特征抽取模型获取更新后的一致性损失,基于更新后的分类层获取更新后的交叉熵损失,将更新后的一致性损失和交叉熵损失求和得到更新后总损失,基于更新后的总损失更新所述特征抽取模型和分类层的模型参数的步骤,直至所述更新后的总损失小于或者等于预设阈值,得到训练好的特征抽取模型和分类层;
识别模块,被配置为使用所述训练好的特征抽取模型和分类层自所述目标原图中识别所述目标。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202311168441.8A 2023-09-12 2023-09-12 目标识别方法、装置、电子设备及存储介质 Active CN116912631B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311168441.8A CN116912631B (zh) 2023-09-12 2023-09-12 目标识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311168441.8A CN116912631B (zh) 2023-09-12 2023-09-12 目标识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN116912631A CN116912631A (zh) 2023-10-20
CN116912631B true CN116912631B (zh) 2023-12-12

Family

ID=88355023

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311168441.8A Active CN116912631B (zh) 2023-09-12 2023-09-12 目标识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116912631B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977832A (zh) * 2019-03-19 2019-07-05 腾讯科技(深圳)有限公司 一种图像处理方法、装置及存储介质
CN114330576A (zh) * 2021-12-30 2022-04-12 北京百度网讯科技有限公司 模型处理方法、装置、图像识别方法及装置
WO2022087778A1 (zh) * 2020-10-26 2022-05-05 深圳大学 一种基于多层耦合映射的低分辨率图像识别方法
CN114764870A (zh) * 2021-01-13 2022-07-19 腾讯科技(深圳)有限公司 对象定位模型处理、对象定位方法、装置及计算机设备

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110504029B (zh) * 2019-08-29 2022-08-19 腾讯医疗健康(深圳)有限公司 一种医学图像处理方法、医学图像识别方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977832A (zh) * 2019-03-19 2019-07-05 腾讯科技(深圳)有限公司 一种图像处理方法、装置及存储介质
WO2022087778A1 (zh) * 2020-10-26 2022-05-05 深圳大学 一种基于多层耦合映射的低分辨率图像识别方法
CN114764870A (zh) * 2021-01-13 2022-07-19 腾讯科技(深圳)有限公司 对象定位模型处理、对象定位方法、装置及计算机设备
CN114330576A (zh) * 2021-12-30 2022-04-12 北京百度网讯科技有限公司 模型处理方法、装置、图像识别方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于数据增广的监控人脸识别算法研究;林旺庆;《中国优秀硕士学位论文全文数据库 信息科技辑》;第I138-272页 *
监控环境下的人脸识别关键技术研究;胡广;《中国优秀硕士学位论文全文数据库 信息科技辑》;第I138-650页 *

Also Published As

Publication number Publication date
CN116912631A (zh) 2023-10-20

Similar Documents

Publication Publication Date Title
CN107633218B (zh) 用于生成图像的方法和装置
CN109508681B (zh) 生成人体关键点检测模型的方法和装置
CN108229419B (zh) 用于聚类图像的方法和装置
CN109255337B (zh) 人脸关键点检测方法和装置
CN109118456B (zh) 图像处理方法和装置
CN112258512A (zh) 点云分割方法、装置、设备和存储介质
CN111915480B (zh) 生成特征提取网络的方法、装置、设备和计算机可读介质
CN111784712B (zh) 图像处理方法、装置、设备和计算机可读介质
CN109934142B (zh) 用于生成视频的特征向量的方法和装置
CN114330565A (zh) 一种人脸识别方法及装置
CN116385328A (zh) 基于为图像添加噪声的图像数据增强方法及装置
CN116403250A (zh) 存在遮挡的人脸识别方法及装置
CN117392260B (zh) 一种图像生成方法及装置
CN109919220B (zh) 用于生成视频的特征向量的方法和装置
CN117894038A (zh) 一种图像中对象姿态生成方法和装置
CN113255812A (zh) 视频边框检测方法、装置和电子设备
CN115984783B (zh) 人群计数方法及装置
CN116912631B (zh) 目标识别方法、装置、电子设备及存储介质
CN116188254A (zh) 基于傅里叶域的超分图像处理方法、装置、设备及介质
CN113763405A (zh) 一种图像检测方法和装置
CN111680754A (zh) 图像分类方法、装置、电子设备及计算机可读存储介质
CN111639198A (zh) 媒体文件识别方法、装置、可读介质及电子设备
CN117372685B (zh) 目标检测方法、装置、电子设备及存储介质
CN113239943B (zh) 基于部件语义图的三维部件提取组合方法和装置
CN115659241A (zh) 训练数据集的标注方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant