CN111931823A

CN111931823A - 一种细粒度图像分类模型处理方法和装置

Info

Publication number: CN111931823A
Application number: CN202010687337.XA
Authority: CN
Inventors: 林春伟; 刘莉红; 刘玉宇
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-07-16
Filing date: 2020-07-16
Publication date: 2020-11-13
Anticipated expiration: 2040-07-16
Also published as: CN111931823B

Abstract

本发明实施例提供了涉及图像分类技术领域的一种细粒度图像分类模型处理方法，包括：根据获取的数据集生成包含至少两个样本的第一数据；根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；根据预制规则提取所述第二数据的样本形成样本对；通过预置欧拉模型处理所述样本对获得数据损失值；根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。本发明能够实现缩小类间距并增大类内距，使得细粒度图像分类模型能够提升细粒度图像分类的性能。

Description

一种细粒度图像分类模型处理方法和装置

技术领域

本发明涉及图像分类技术领域，特别是涉及一种细粒度图像分类模型处理方法和一种细粒度图像分类模型处理装置。

背景技术

作为计算机视觉中一个经典、基本且具有挑战性的问题，细粒度图像分类一直是数十年来研究的活跃领域。细粒度图像分类的目标是检索和识别出在同一个大类(即元类别)下不同子类的图像。例如，不同属类的动物/植物，不同型号的汽车，不同种类的零售产品等。

中国专利公开号为CN109800754A的一种基于卷积神经网络的古字体分类方法，涉及基于分类任务的目标函数将中心损失函数与传统的交叉熵损失函数配合使用，增大类间距离并减小类内距离，在一定程度上提高了特征的分辨能力，通过预先定义好的网络模型对预处理后的图像进行训练，利用混淆矩阵对分类结果准确率进行评估。

但是，上述专利公开的技术方案中系统运算量较大，并且提高的分类结果准确率较低。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种细粒度图像分类模型处理方法和相应的一种细粒度图像分类模型处理装置。

为了解决上述问题，本发明实施例公开了一种细粒度图像分类模型处理方法，包括：

根据获取的数据集生成包含至少两个样本的第一数据；

根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；

根据预制规则提取所述第二数据的样本形成样本对；

通过预置欧拉模型处理所述样本对获得数据损失值；

根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。

可选地，根据预制规则提取所述第二数据的样本形成样本对包括：

获取两组所述第二数据中相同序列的样本组成多个样本对。

可选地，所述通过预置欧拉模型处理所述样本对获得数据损失值包括：

通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值；

对所述样本损失值进行求和，得到数据损失值。

可选地，所述通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值包括：

当所述样本对中的样本类别相同时，根据预设置交叉熵损失函数和欧拉混淆项分别得出交叉熵损失和欧拉损失；

根据所述交叉熵损失和所述欧拉损失得到样本损失值。

可选地，所述根据所述交叉熵损失和所述欧拉损失得到样本损失值包括：

对所述欧拉损失进行附加权重后，与所述交叉熵损失进行求和，得到样本损失值。

本发明实施例还公开了一种细粒度图像分类模型处理装置，包括：

生成模块，用于根据获取的数据集生成包含至少两个样本的第一数据；

变序模块，用于根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；

获取模块，用于根据预制规则提取所述第二数据的样本形成样本对；

欧拉模型，用于通过预置欧拉模型处理所述样本对获得数据损失值；

更新模块，用于根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。

可选地，所述生成模块包括：

选取模块，用于获取两组所述第二数据中相同序列的样本组成多个样本对。

可选地，所述欧拉模型包括：

孪生欧拉模块，用于通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值；

计算模块，用于对所述样本损失值进行求和，得到数据损失值。

本发明实施例还公开了一种电子设备，包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现所述的细粒度图像分类模型处理方法的步骤。

本发明实施例还公开了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现所述的细粒度图像分类模型处理方法的步骤。

本发明实施例包括以下优点：通过在交叉熵损失上添加一项新的欧拉混淆项，迫使模型学习类间更加细微的特征，端对端地实现增大类间距离与缩小类内距离的目标；同时通过对传统的模型添加一个完全相同、共享权重分支，并对每一个第一数据都进行两次随机排序，新的孪生网络能够高效地计算出欧拉混淆。本发明所提出的方法能够实现缩小类间距并增大类内距，使得细粒度图像分类模型能够提升细粒度图像分类的性能。

附图说明

图1是本发明的一种细粒度图像分类模型处理方法第一实施例的步骤流程图；

图2是本发明的一种细粒度图像分类模型处理方法第二实施例的步骤流程图；

图3是本发明的一种细粒度图像分类模型处理方法第三实施例的步骤流程图；

图4是本发明的一种细粒度图像分类模型处理方法第四实施例的步骤流程图；

图5是本发明的一种细粒度图像分类模型处理装置第一实施例的结构框图；

图6是本发明的一种细粒度图像分类模型处理装置第二实施例的结构框图；

图7是本发明的一种细粒度图像分类模型处理装置第三实施例的结构框图；

图8是本发明实现细粒度图像分类模型处理方法的电子设备。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

本发明实施例的核心构思之一在于，通过在交叉熵损失上添加一项新的欧拉混淆项，迫使模型学习类间更加细微的特征，端对端地实现增大类间距离与缩小类内距离的目标；同时通过对传统的模型添加一个完全相同、共享权重分支，并对每一个第一数据都进行两次随机排序，新的孪生网络能够高效地计算出欧拉混淆。本发明所提出的方法能够实现缩小类间距并增大类内距，使得细粒度图像分类模型能够提升细粒度图像分类的性能，被广泛应用于现实世界的问题中，如渔业监测中的鱼种分类、交通监测中的车辆重识别等问题。

参照图1，示出了本发明的一种细粒度图像分类模型处理方法实施例的步骤流程图，具体可以包括如下步骤：

S100、根据获取的数据集生成包含至少两个样本的第一数据；

S200、根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；

S300、根据预制规则提取所述第二数据的样本形成样本对；

S400、通过预置欧拉模型处理所述样本对获得数据损失值；

S500、根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。

获取输入的数据集，所述数据集表示为：

其中m_i表示第i类共有m_i个样本，对于某一类所包含的样本则可以用集合

表示；从所述数据集获取包含多个多种类别样本的第一数据，所述第一数据可以表示为

改变所述第一数据的样本排序得到两组变序数据，并依样本次序同时在每组变序数据中选取一个样本组成样本对；通过预设置欧拉模型的孪生欧拉模块计算所述样本对的样本损失值，并对所述样本损失值求和得到第一数据的数据损失值；根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型，即将所述数据损失值输入到细粒度图像分类模型中进行分类训练。

参照图2，根据预制规则提取所述第二数据的样本形成样本对包括：

S310、获取两组所述第二数据中相同序列的样本组成多个样本对。

对于每一个第一数据D，首先对其中所有的样本进行两次随机排序，即预设规则，得到两个数据相同但顺序不同的第一数据D1、D2(即第二数据)，然后按顺序分别从所述第二数据D1、D2各取出一个样本，组成一个配对，例如：第二数据

第二数据

参照图3，所述通过预置欧拉模型处理所述样本对获得数据损失值包括：

S410、通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值；

S420、对所述样本损失值进行求和，得到数据损失值。

将所述样本对中的样本分别送入预设置欧拉模型的孪生欧拉模块，具体的，将一样本输入到所述孪生欧拉模块的某一欧拉通道，同时将另一样本输入到所述孪生欧拉模块的另一欧拉通道，各欧拉通道对于输入的样本都能计算一个交叉熵，同时所述样本对中的两个样本都来自同一个类别时，两个欧拉通道的结果还能一起计算一个欧式距离。这三项(或者两项)共同组成了该样本对对应的损失。根据公式：

计算该样本对对应的损失。其中λ表示交叉熵和混淆的权重。将所有样本对都输入所述孪生欧拉模块，把各个样本对对应的损失累加求和

参照图4，所述通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值包括：

S421、当所述样本对中的样本类别相同时，根据预设置交叉熵损失函数和欧拉混淆项分别得出交叉熵损失和欧拉损失；

S422、根据所述交叉熵损失和所述欧拉损失得到样本损失值。

将一样本输入到所述孪生欧拉模块的某一欧拉通道，同时将另一样本输入到所述孪生欧拉模块的另一欧拉通道，各欧拉通道对于输入的样本都能计算一个交叉熵，同时所述样本对中的两个样本都来自同一个类别时，两个欧拉通道的结果还能一起计算一个欧式距离。这三项(或者两项)共同组成了该样本对对应的损失。

所述根据所述交叉熵损失和所述欧拉损失得到样本损失值包括：

孪生欧拉模块的两欧拉通道结构完全相同，并且在训练过程中共享权重。每一次输入一批数据，首先对其随机排序两次，配对后依次把样本对分别送入这两个网络分支(两欧拉通道)，各网络分支对于输入的样本都能计算一个交叉熵，同时配对中的两个样本都来自同一个类别时，两个网络分支的结果还能一起计算一个欧式距离。这三项(或者两项)共同组成了这个配对对应的损失。最后依次把各个配对的损失相加求和，即可对网络(细粒度图像分类模型)进行更新。详细的训练步骤如下：

对于每一个批处理数据，随机排序两次，获得两个数据相同当顺序不同的批处理D1、D2。

依次从两个批处理数据中各取出一个样本组成样本对，分别送入两个网络分支，计算改样本对对应的损失：

其中λ表示交叉熵和混淆的权重。

将该批处理数据所有样本对都输入网络，把各个配对对应的损失累加求和

更新网络。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图5，示出了本发明的一种细粒度图像分类模型处理装置实施例的结构框图，具体可以包括如下模块：

生成模块100，用于根据获取的数据集生成包含至少两个样本的第一数据；

变序模块200，用于根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；

提取模块300，根据预制规则提取所述第二数据的样本形成样本对；

欧拉模型400，用于通过预设置欧拉模型400对所述样本对进行计算，得到数据损失值；

更新模块500，用于根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。

生成模块100，用于获取输入的数据集，所述数据集表示为：

变序模块200，用于根据预设规则处理所述第一数据的样本排序得到至少两组第二数据，在本实施例中得到两组所述第二数据；提取模块300，根据预制规则提取两组所述第二数据中相同序列的样本组成多个样本对；欧拉模型400，用于通过预设置欧拉模型400的孪生欧拉模块计算所述样本对的样本损失值，并对所述样本损失值求和得到第一数据的数据损失值；更新模块500，用于根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型，即将所述数据损失值输入到细粒度图像分类模型中进行分类训练。

参照图6，所述提取模块300包括：

选取模块310，用于获取两组所述第二数据中相同序列的样本组成多个样本对。

第二数据

参照图7，所述欧拉模型400包括：

孪生欧拉模块410，用于通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值；

计算模块420，用于对所述样本损失值进行求和，得到数据损失值。

将所述样本对中的样本分别送入预设置欧拉模型400的孪生欧拉模块410，具体的，将一样本输入到所述孪生欧拉模块410的某一欧拉通道，同时将另一样本输入到所述孪生欧拉模块410的另一欧拉通道，各欧拉通道对于输入的样本都能计算一个交叉熵，同时所述样本对中的两个样本都来自同一个类别时，两个欧拉通道的结果还能一起计算一个欧式距离。这三项(或者两项)共同组成了该样本对对应的损失。根据公式：

计算该样本对对应的损失。其中λ表示交叉熵和混淆的权重。将所有样本对都输入所述孪生欧拉模块410，把各个样本对对应的损失累加求和

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

参照图8，在本发明实施例中，本发明还提供一种计算机设备，上述计算机设备12以通用计算设备的形式表现，计算机设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线18结构中的一种或多种，包括存储器总线18或者存储器控制器，外围总线18，图形加速端口，处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线18，微通道体系结构(MAC)总线18，增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(RAM)31和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图8中未示出，可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD～ROM，DVD～ROM或者其他光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块42，这些程序模块42被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具41，可以存储在例如存储器中，这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信，还可与一个或者多个使得用户能与该计算机设备12交互的设备通信，和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN))，广域网(WAN)和/或公共网络(例如因特网)通信。如图所示，网络适配器21通过总线18与计算机设备12的其他模块通信。应当明白，尽管图中未示出，可以结合计算机设备12使用其他硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的细粒度图像分类模型处理方法。

即上述处理单元16执行上述程序时实现：根据获取的数据集生成包含至少两个样本的第一数据；根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；根据预制规则提取所述第二数据的样本形成样本对；通过预置欧拉模型处理所述样本对获得数据损失值；根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。

在本发明实施例中，本发明还提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请所有实施例提供的细粒度图像分类模型处理方法。

也即，给程序被处理器执行时实现：根据获取的数据集生成包含至少两个样本的第一数据；根据预设规则处理所述第一数据的样本排序得到至少两组第二数据；根据预制规则提取所述第二数据的样本形成样本对；通过预置欧拉模型处理所述样本对获得数据损失值；根据所述数据损失值处理预置的第一细粒度图像分类模型获得第二细粒度图像分类模型。

可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPOM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD～ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，改计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种细粒度图像分类模型处理方法和一种细粒度图像分类模型处理装置，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种细粒度图像分类模型处理方法，其特征在于，包括：

根据获取的数据集生成包含至少两个样本的第一数据；

根据预制规则提取所述第二数据的样本形成样本对；

通过预置欧拉模型处理所述样本对获得数据损失值；

2.根据权利要求1所述的方法，其特征在于，根据预制规则提取所述第二数据的样本形成样本对包括：

获取两组所述第二数据中相同序列的样本组成多个样本对。

3.根据权利要求1所述的方法，其特征在于，所述通过预置欧拉模型处理所述样本对获得数据损失值包括：

对所述样本损失值进行求和，得到数据损失值。

4.根据权利要求3所述的方法，其特征在于，所述通过预设置孪生欧拉模块对所述样本对进行计算，得到样本损失值包括：

根据所述交叉熵损失和所述欧拉损失得到样本损失值。

5.根据权利要求4所述的方法，其特征在于，所述根据所述交叉熵损失和所述欧拉损失得到样本损失值包括：

6.一种细粒度图像分类模型处理装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述生成模块包括：

8.根据权利要求6所述的装置，其特征在于，所述欧拉模型包括：

9.电子设备，其特征在于，包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的细粒度图像分类模型处理方法的步骤。

10.计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的细粒度图像分类模型处理方法的步骤。