CN113989596B - 图像分类模型的训练方法及计算机可读存储介质 - Google Patents

图像分类模型的训练方法及计算机可读存储介质 Download PDF

Info

Publication number
CN113989596B
CN113989596B CN202111585657.5A CN202111585657A CN113989596B CN 113989596 B CN113989596 B CN 113989596B CN 202111585657 A CN202111585657 A CN 202111585657A CN 113989596 B CN113989596 B CN 113989596B
Authority
CN
China
Prior art keywords
image
classification model
cluster
label vector
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111585657.5A
Other languages
English (en)
Other versions
CN113989596A (zh
Inventor
刘国清
杨广
王启程
郑伟
张孟华
杨国武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Youjia Innovation Technology Co ltd
Original Assignee
Shenzhen Minieye Innovation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Minieye Innovation Technology Co Ltd filed Critical Shenzhen Minieye Innovation Technology Co Ltd
Priority to CN202111585657.5A priority Critical patent/CN113989596B/zh
Publication of CN113989596A publication Critical patent/CN113989596A/zh
Application granted granted Critical
Publication of CN113989596B publication Critical patent/CN113989596B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种图像分类模型的训练方法,包括:根据第一图像训练初始分类模型以得到中间分类模型,其中,第一图像为有标签图像;根据中间分类模型对第二图像进行聚类处理以得到若干聚类簇,其中,第二图像为无标签图像;计算每一聚类簇的中心点;根据聚类簇的中心点计算相应的伪标签;以及根据第一图像、第二图像、中心点以及伪标签训练中间分类模型以得到图像分类模型。此外,本发明还提供了一种计算机可读存储介质。本发明技术方案有效解决了有标签图像数据量小导致图像分类模型准确度不高的问题。

Description

图像分类模型的训练方法及计算机可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种图像分类模型的训练方法及计算机可读存储介质。
背景技术
近年来,随着大数据和深度学习技术的飞速发展,深度神经网络极大地推动了图像分类和检测领域的进步。因为深度神经网络可以更有效地从大量样本中学习图像特征,避免了传统图像分类算法中复杂的特征提取过程,实现了端到端的分类检测。现有的基于深度神经网络的图像分类算法包括有监督算法和无监督算法。其中,有监督算法利用标注数据进行训练,但是数据的标注需要耗费大量人力和时间;无监督算法利用无标注数据进行训练,但是训练得到的模型准确率不高。
发明内容
本发明提供了一种图像分类模型的训练方法及计算机可读存储介质,用于解决有标签图像数据量小导致图像分类模型准确度不高的问题。
第一方面,本发明实施例提供一种图像分类模型的训练方法,所述图像分类模型的训练方法包括:
根据第一图像训练初始分类模型以得到中间分类模型,其中,所述第一图像为有标签图像;
根据所述中间分类模型对第二图像进行聚类处理以得到若干聚类簇,其中,所述第二图像为无标签图像;
计算每一所述聚类簇的中心点;
根据所述聚类簇的中心点计算相应的伪标签;以及
根据所述第一图像、所述第二图像、所述中心点以及所述伪标签训练所述中间分类模型以得到图像分类模型。
第二方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质用于存储程序指令,所述程序指令可被处理器执行以实现如上所述的图像分类模型的训练方法。
上述图像分类模型的训练方法及计算机可读存储介质,根据有标签的第一图像对初始分类模型进行有监督训练,得到中间分类模型。对无标签的第二图像进行聚类以得到若干聚类簇,并计算聚类簇的中心点和中心点的伪标签。根据第一图像和聚类后的第二图像对中间分类模型进行迭代训练,得到图像分类模型。根据半监督学习的思想,利用少量的第一图像和大量的第二图像,就能够训练得到准确率较高的图像分类模型,提高图像分类模型的性能,增大分类预测的准确率,从而解决有标签图像数据量小导致图像分类模型准确度不高的问题,极大降低了训练成本。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明实施例提供的图像分类模型的训练方法的流程图。
图2为本发明实施例提供的图像分类模型的训练方法的第一子流程图。
图3为本发明实施例提供的图像分类模型的训练方法的第二子流程图。
图4为本发明实施例提供的图像分类模型的训练方法的第三子流程图。
图5为本发明实施例提供的终端的内部结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的规划对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,换句话说,描述的实施例根据除了这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,还可以包含其他内容,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于只清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者多个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
请结合参看图1,其为本发明实施例提供的图像分类模型的训练方法的流程图。训练方法用于训练图像分类模型,训练得到的图像分类模型能够对无标签图像进行分类。图像分类模型的训练方法具体包括如下步骤。
步骤S102,根据第一图像训练初始分类模型以得到中间分类模型。其中,第一图像为有标签图像,第一图像包括真实标签向量。根据第一图像对初始分类模型进行有监督训练。具体地,将第一图像输入初始分类模型以得到相应的初始标签向量,根据真实标签向量和初始标签向量更新初始分类模型的参数以得到中间分类模型。在本实施例中,在训练初始分类模型之前,设置有若干预设类别。其中,真实标签向量中数值的数量与预设类别的数量相同,真实标签向量中的数值与预设类别一一对应。
步骤S104,根据中间分类模型对第二图像进行聚类处理以得到若干聚类簇。其中,第二图像为无标签图像。若干聚类簇的数量与预设类别的数量相同。每一第二图像属于且仅属于一个聚类簇,每一聚类簇包括多幅第二图像。根据中间分类模型对第二图像进行聚类处理以得到若干聚类簇的具体过程将在下文详细描述。
步骤S106,计算每一聚类簇的中心点。其中,第二图像包括图像矩阵。计算每一聚类簇中所有第二图像的图像矩阵的平均值作为相应聚类簇的中心点。可以理解的是,中心点为图像矩阵,可以相当于一幅图像。
步骤S108,根据聚类簇的中心点计算相应的伪标签。在本实施例中,将每一第二图像输入中间分类模型以得到相应的第一标签向量,计算每一聚类簇中所有第二图像的第一标签向量的平均值作为相应聚类簇的伪标签。
步骤S110,根据第一图像、第二图像、中心点以及伪标签训练中间分类模型以得到图像分类模型。根据第一图像、第二图像、中心点以及伪标签对中间分类模型进行半监督训练,并迭代更新中间分类模型的参数,以得到图像分类模型。根据第一图像、第二图像、中心点以及伪标签训练中间分类模型以得到图像分类模型的具体过程将在下文详细描述。
上述实施例中,根据有标签的第一图像对初始分类模型进行有监督训练,得到中间分类模型。对无标签的第二图像进行聚类以得到若干聚类簇,并计算聚类簇的中心点和中心点的伪标签。根据第一图像和聚类后的第二图像对中间分类模型进行迭代训练,得到图像分类模型。根据半监督学习的思想,利用少量的第一图像和大量的第二图像,就能够训练得到准确率较高的图像分类模型,提高图像分类模型的性能,增大分类预测的准确率,从而解决有标签图像数据量小导致图像分类模型准确度不高的问题,极大降低了训练成本。
可以理解的是,图像分类模型的训练方法不仅可以用于训练图像分类模型,还可以用于训练语音、文字等分类模型。当训练方法用于训练语音或者文字等分类模型时,只需要在训练的过程中,相应地将第一图像换成有标签的语音或者有标签的文字,将第二图像换成无标签的语音或者无标签的文字即可,在此不再一一赘述。
请结合参看图2,其为本发明实施例提供的图像分类模型的训练方法的第一子流程图。步骤S104具体包括如下步骤。
步骤S202,将每一第二图像输入中间分类模型以得到相应的第一标签向量。可以理解的是,利用中间分类模型为每一第二图像预测一个第一标签向量。
步骤S204,随机选取若干第二图像作为中心图像。从所有第二图像中随机选取若干第二图像作为中心图像。其中,中心图像的数量与预设类别的数量相同,一个中心图像为一个聚类簇的中心点。相应地,每一中心图像均包括一个第一标签向量。
步骤S206,根据第二图像的第一标签向量与中心图像的第一标签向量之间的第一距离将第二图像划分为若干聚类簇。在本实施例中,计算第二图像的第一标签向量与每一中心图像的第一标签向量之间的欧式距离作为第一距离,将第二图像划分至与最小第一距离对应的中心图像所在的聚类簇。可以理解的是,第一距离越小,表示第二图像和中心图像越相似;第一距离越大,表示第二图像和中心图像越不相似。具体地,每一第二图像均有相对应的若干第一距离。若干第一距离的数量与聚类簇的数量相同。将每一第二图像所对应的若干第一距离按照从小到大的顺序进行排序,并选取最小第一距离所对应的中心图像作为最相似图像。将第二图像划分至最相似的中心图像所在的聚类簇,从而形成若干聚类簇。其中,每一聚类簇中的第二图像具有相似的特征。
步骤S208,计算每一聚类簇的中心点。根据第二图像的图像矩阵,计算每一聚类簇中所有第二图像的图像矩阵的平均值作为相应聚类簇的中心点。可以理解的是,中心点为图像矩阵,可以相当于一幅图像。
步骤S210,根据聚类簇的中心点和第一标签向量更新每一聚类簇的中心点,直至中心点不再变化。在本实施例中,若干聚类簇中,只要有一个聚类簇的中心点还在变化,则所有聚类簇的中心点都需要再次进行更新,直至所有聚类簇的中心点同时不再变化。根据聚类簇的中心点和第一标签向量更新每一聚类簇的中心点,直至中心点不再变化的具体过程将在下文详细描述。
步骤S212,将中心点不再变化的聚类簇作为聚类簇。当所有聚类簇的中心点同时不再变化时,表示聚类簇中的第二图像与相应中心点都是最相似的。因此,将中心点不再变化的聚类簇作为中间分类模型训练的聚类簇。
上述实施例中,根据第二图像的第一标签向量和中心图像的第一标签向量之间的第一距离对第二图像进行聚类处理,从而得到若干聚类簇。可以理解的是,将第二图像中与中心图像相似的第二图像划分为同一个聚类簇,从而能够有效利用聚类簇中第二图像相似的图像信息。
请结合参看图3,其为本发明实施例提供图像分类模型的训练方法的第二子流程图。步骤S210具体包括如下步骤。
步骤S302,将每一聚类簇的中心点输入中间分类模型以得到相应的中心标签向量。由于中心点相当于一幅图像,因此将中心点输入中间分类模型,可以得到相应的中心标签向量。
步骤S304,计算第二图像的第一标签向量与每一中心点的中心标签向量之间的第二距离。计算第二图像的第一标签向量与每一中心点的中心标签向量之间的欧式距离作为第二距离。可以理解的是,第二距离越小,表示第二图像与中心点越相似;第二距离越大,表示第二图像与中心点越不相似。具体地,每一第二图像均与若干第二距离相对应。若干第二距离的数量与聚类簇的数量相同。
步骤S306,根据第二距离将第二图像重新划分至相应的中心点所在的聚类簇,并再次计算聚类簇的中心点。将每一第二图像所对应的若干第二距离按照从小到大的顺序进行排序,并选取最小第二距离所对应的中心点作为最相似中心点。将第二图像划分至最相似中心点所在的聚类簇,从而形成新的聚类簇。计算新的聚类簇的中心点。
步骤S308,判断当前聚类簇的中心点与上一聚类簇的中心点是否相同。在本实施例中,新的聚类簇为当前聚类簇,新的聚类簇之前的一个聚类簇为上一聚类簇。其中,当前聚类簇的数量和上一聚类簇的数量相同,且当前聚类簇与上一聚类簇一一对应。可以理解的是,当当前聚类簇的中心点与上一聚类簇的中心点不相同时,表示上一聚类簇中存在第二图像与上一聚类簇的中心点不是最相似的。即,上一聚类簇的所有第二图像中存在与其它第二图像不是最相似的第二图像,因此需要将所有第二图像重新进行划分,并重新计算划分后的聚类簇的中心点。
步骤S310,当当前聚类簇的中心点与上一聚类簇的中心点相同时,判断聚类簇的中心点不再变化。可以理解的是,当当前聚类簇的中心点与上一聚类簇的中心点相同时,表示当前聚类簇中所有第二图像均与当前聚类簇的中心点最相似。即,当前聚类簇的所有第二图像之间都是最相似的。
上述实施例中,当对第二图像进行第一次划分得到初始的聚类簇之后,根据第二图像的第一标签向量和聚类簇中心点的中心标签向量之间的第二距离重新对第二图像进行聚类处理。多次对第二图像进行聚类直至最终得到的聚类簇的中心点不再发生变化,使得聚类簇中所有第二图像都是最相似的,从而能够有效利用聚类簇中第二图像的相似信息,使得训练中间分类模型的过程能够更加可靠。
请结合参看图4,其为本发明实施例提供的图像分类模型的训练方法的第三子流程图。步骤S110具体包括如下步骤。
步骤S402,将第一图像划分为训练集和验证集。在本实施例中,将所有第一图像随机划分为训练集和验证集。其中,训练集中第一图像的数量为所有第一图像的数量的80-90%,验证集中第一图像的数量为所有第一图像的数量的10-20%。优选地,训练集中第一图像的数量为所有第一图像的数量的80%,验证集中第一图像的数量为所有第一图像的数量的20%。
步骤S404,将训练集中的第一图像输入中间分类模型以得到第二标签向量。将训练集中的每一第一图像均输入中间分类模型以得到相应的第二标签向量。
步骤S406,根据第二标签向量和真实标签向量构建第一损失值。计算每一第一图像的第二标签向量和真实标签向量的交叉熵,将训练集中所有第一图像的交叉熵的平均值作为第一损失值。在本实施例中,根据第一公式构建第一损失值。具体地,第一公式为
Figure 93045DEST_PATH_IMAGE001
。其中,
Figure 293082DEST_PATH_IMAGE002
表示第一损失值,
Figure 568337DEST_PATH_IMAGE003
表示训练集的第一图像,
Figure 853824DEST_PATH_IMAGE004
表示训练集中第一图像的数量,
Figure 121995DEST_PATH_IMAGE005
表示真实标签向量,
Figure 176538DEST_PATH_IMAGE006
表示第二标签向量,
Figure 888274DEST_PATH_IMAGE007
表示第二标签向量和真实标签向量的交叉熵。
步骤S408,将中心点输入中间分类模型以得到第三标签向量。将每一聚类簇的中心点输入中间分类模型以得到相应的第三标签向量。
步骤S410,根据第三标签向量和伪标签构建第二损失值。计算每一聚类簇的第三标签向量和伪标签的交叉熵,将所有聚类簇的交叉熵的平均值作为第二损失值。在本实施例中,根据第二公式构建第二损失值。具体地,第二公式为
Figure 661058DEST_PATH_IMAGE009
。其中,
Figure 467340DEST_PATH_IMAGE011
表示第二损失值,
Figure 641969DEST_PATH_IMAGE013
表示聚类簇,
Figure 259026DEST_PATH_IMAGE015
表示聚类簇的数量,
Figure 519106DEST_PATH_IMAGE017
表示伪标签,
Figure 332341DEST_PATH_IMAGE019
表示聚类簇的中心点,
Figure 361477DEST_PATH_IMAGE021
表示第三标签向量,
Figure 664283DEST_PATH_IMAGE023
表示第三标签向量和伪标签的交叉熵。
步骤S412,将第二图像输入中间分类模型以得到第一标签向量。将每一第二图像输入中间分类模型以得到相应的第一标签向量。
步骤S414,根据第一标签向量和第三标签向量构建第三损失值。计算每一第二图像的第一标签向量和相应聚类簇的第三标签向量之间的均方误差,将所有第二图像的均方误差的平均值作为第三损失值。可以理解的是,每一第二图像只与相对应的聚类簇进行计算,因此,每一第二图像均对应一个均方误差。在本实施例中,根据第三公式构建第三损失值。具体地,第三公式为
Figure 693550DEST_PATH_IMAGE024
。其中,
Figure 310476DEST_PATH_IMAGE026
表示第三损失值,
Figure 194118DEST_PATH_IMAGE028
表示第二图像,
Figure 667825DEST_PATH_IMAGE030
表示第二图像的数量,
Figure 387650DEST_PATH_IMAGE032
表示第一标签向量,
Figure 605005DEST_PATH_IMAGE021
表示第三标签向量,
Figure 608733DEST_PATH_IMAGE034
表示第一标签向量和第三标签向量之间的均方误差。
步骤S416,根据第一损失值、第二损失值以及第三损失值训练中间分类模型。根据第一损失值、第二损失值以及第三损失值构建总损失值,利用随机梯度下降法根据总损失值更新中间分类模型的参数。在本实施例中,根据第四公式构建总损失值。具体地,第四公式为
Figure 456603DEST_PATH_IMAGE036
。其中,
Figure 912993DEST_PATH_IMAGE038
表示总损失值,
Figure 684771DEST_PATH_IMAGE040
表示第一损失值,
Figure 480688DEST_PATH_IMAGE011
表示第二损失值,
Figure 561777DEST_PATH_IMAGE026
表示第三损失值,
Figure 505462DEST_PATH_IMAGE042
表示系数。
步骤S418,根据验证集选取中间分类模型在训练过程中形成的最优分类模型。在本实施例中,将验证集中的第一图像输入更新参数后的中间分类模型并获取相应的第四标签向量,根据第四标签向量和真实标签向量计算相应的中间分类模型的准确率,并选取准确率最高的中间分类模型作为最优分类模型。具体地,每次中间分类模型的参数更新之后,将验证集中的所有第一图像均输入中间分类模型,并获取相应的第四标签向量。根据第一图像的真实标签向量判断第四标签向量是否正确。当第四标签向量与真实标签向量相同时,判断第四标签向量正确。统计第四标签向量正确的次数,根据第四标签向量正确的次数和验证集中第一图像的数量计算中间分类模型的准确率。其中,每次中间分类模型的参数更新之后,都对中间分类模型的准确率进行计算,并将当前计算得到的准确率与上一次计算得到的准确率进行比较,保留准确率较高的中间分类模型。当中间分类模型的参数不再变化或者中间分类模型的训练次数达到预设次数时,更新结束。相应地,保留着的准确率较高的中间分类模型为更新过程中准确率最高的中间分类模型,则将保留着的准确率较高的中间分类模型选取作为最优分类模型。
步骤S420,将最优分类模型作为图像分类模型。
上述实施例中,根据第二标签向量和真实标签向量构建第一损失值,根据第三标签向量和伪标签构建第二损失值,将第一损失值和第二损失值作为有监督损失项;根据第一标签向量和第三标签向量构建第三损失值,将第三损失值作为无监督损失项,能够更加准确地对中间分类模型的参数进行更新。根据验证集计算每次训练后的中间分类模型的准确率,选取准确率最高的中间分类模型作为图像分类模型,从而能够有效保障图像分类模型的准确率。
请结合参看图5,其为本发明实施例提供的终端的内部结构示意图。终端10包括计算机可读存储介质11、处理器12以及总线13。其中,计算机可读存储介质11至少包括一种类型的可读存储介质,该可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。计算机可读存储介质11在一些实施例中可以是终端10的内部存储单元,例如终端10的硬盘。计算机可读存储介质11在另一些实施例中也可以是终端10的外部存储设备,例如终端10上配备的插接式硬盘、智能存储卡(Smart MediaCard,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,计算机可读存储介质11还可以既包括终端10的内部存储单元也包括外部存储设备。计算机可读存储介质11不仅可以用于存储安装于终端10的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
总线13可以是外设部件互连标准(peripheral component interconnect,PCI)总线或扩展工业标准结构(extended industry standard architecture,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
进一步地,终端10还可以包括显示组件14。显示组件14可以是发光二极管(LightEmitting Diode,LED)显示器、液晶显示器、触控式液晶显示器以及有机发光二极管(Organic Light-Emitting Diode,OLED)触摸器等。其中,显示组件14也可以适当的称为显示装置或显示单元,用于显示在终端10中处理的信息以及用于显示可视化的用户界面。
进一步地,终端10还可以包括通信组件15。通信组件15可选地可以包括有线通信组件和/或无线通信组件,如WI-FI通信组件、蓝牙通信组件等,通常用于在终端10与其他智能控制设备之间建立通信连接。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行计算机可读存储介质11中存储的程序代码或处理数据。具体地,处理器12执行处理程序以控制终端10实现图像分类模型的训练方法。
图5仅示出了具有组件11-15、用于实现图像分类模型的训练方法的终端10,本领域技术人员可以理解的是,图5示出的结构并不构成对终端10的限定,终端10可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘且本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所列举的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属于本发明所涵盖的范围。

Claims (9)

1.一种图像分类模型的训练方法,其特征在于,所述图像分类模型的训练方法包括:
根据第一图像训练初始分类模型以得到中间分类模型,其中,所述第一图像为有标签图像;
根据所述中间分类模型对第二图像进行聚类处理以得到若干聚类簇,其中,所述第二图像为无标签图像;
计算每一所述聚类簇的中心点;
根据所述聚类簇的中心点计算相应的伪标签;以及
根据所述第一图像、所述第二图像、所述中心点以及所述伪标签训练所述中间分类模型以得到图像分类模型,其中,根据所述第一图像、所述第二图像、所述中心点以及所述伪标签训练所述中间分类模型以得到图像分类模型具体包括:
将所述第一图像划分为训练集和验证集,其中,所述第一图像包括真实标签向量;
将所述训练集中的第一图像输入所述中间分类模型以得到第二标签向量;
根据所述第二标签向量和所述真实标签向量构建第一损失值;
将所述中心点输入所述中间分类模型以得到第三标签向量;
根据所述第三标签向量和所述伪标签构建第二损失值;
将所述第二图像输入所述中间分类模型以得到第一标签向量;
根据所述第一标签向量和所述第三标签向量构建第三损失值;
根据所述第一损失值、所述第二损失值以及所述第三损失值训练所述中间分类模型;
根据所述验证集选取所述中间分类模型在训练过程中形成的最优分类模型;以及
将所述最优分类模型作为所述图像分类模型。
2.如权利要求1所述的图像分类模型的训练方法,其特征在于,根据所述中间分类模型对第二图像进行聚类处理以得到若干聚类簇具体包括:
将每一所述第二图像输入所述中间分类模型以得到相应的第一标签向量;
随机选取若干第二图像作为中心图像;
根据所述第二图像的第一标签向量与所述中心图像的第一标签向量之间的第一距离将所述第二图像划分为若干聚类簇;
计算每一所述聚类簇的中心点;
根据所述聚类簇的中心点和所述第一标签向量更新每一所述聚类簇的中心点,直至所述中心点不再变化;以及
将中心点不再变化的聚类簇作为所述聚类簇。
3.如权利要求2所述的图像分类模型的训练方法,其特征在于,根据所述第二图像的第一标签向量与所述中心图像的第一标签向量之间的第一距离将所述第二图像划分为若干聚类簇具体包括:
计算所述第二图像的第一标签向量与每一所述中心图像的第一标签向量之间的欧式距离作为所述第一距离;以及
将所述第二图像划分至与最小第一距离对应的中心图像所在的聚类簇。
4.如权利要求2所述的图像分类模型的训练方法,其特征在于,根据所述聚类簇的中心点和所述第一标签向量更新每一所述聚类簇的中心点,直至所述中心点不再变化具体包括:
将每一所述聚类簇的中心点输入所述中间分类模型以得到相应的中心标签向量;
计算所述第二图像的第一标签向量与每一所述中心点的中心标签向量之间的第二距离;
根据所述第二距离将所述第二图像重新划分至相应的中心点所在的聚类簇,并再次计算所述聚类簇的中心点;
判断当前聚类簇的中心点与上一聚类簇的中心点是否相同;以及
当当前聚类簇的中心点与上一聚类簇的中心点相同时,判断所述聚类簇的中心点不再变化。
5.如权利要求1所述的图像分类模型的训练方法,其特征在于,所述第二图像包括图像矩阵,计算每一所述聚类簇的中心点具体包括:
计算每一所述聚类簇中所有第二图像的图像矩阵的平均值作为相应聚类簇的中心点。
6.如权利要求1所述的图像分类模型的训练方法,其特征在于,根据所述聚类簇的中心点计算相应的伪标签具体包括:
将每一所述第二图像输入所述中间分类模型以得到相应的第一标签向量;以及
计算每一所述聚类簇中所有第二图像的第一标签向量的平均值作为相应聚类簇的伪标签。
7.如权利要求1所述的图像分类模型的训练方法,其特征在于,根据所述第一损失值、所述第二损失值以及所述第三损失值训练所述中间分类模型具体包括:
根据所述第一损失值、所述第二损失值以及所述第三损失值构建总损失值;以及
利用随机梯度下降法根据所述总损失值更新所述中间分类模型的参数。
8.如权利要求7所述的图像分类模型的训练方法,其特征在于,根据所述验证集选取所述中间分类模型在训练过程中形成的最优分类模型具体包括:
将所述验证集中的第一图像输入更新参数后的中间分类模型并获取相应的第四标签向量;
根据所述第四标签向量和所述真实标签向量计算相应的中间分类模型的准确率;以及
选取准确率最高的中间分类模型作为所述最优分类模型。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序指令,所述程序指令可被处理器执行以实现如权利要求1至8中任一项所述的图像分类模型的训练方法。
CN202111585657.5A 2021-12-23 2021-12-23 图像分类模型的训练方法及计算机可读存储介质 Active CN113989596B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111585657.5A CN113989596B (zh) 2021-12-23 2021-12-23 图像分类模型的训练方法及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111585657.5A CN113989596B (zh) 2021-12-23 2021-12-23 图像分类模型的训练方法及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN113989596A CN113989596A (zh) 2022-01-28
CN113989596B true CN113989596B (zh) 2022-03-22

Family

ID=79734097

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111585657.5A Active CN113989596B (zh) 2021-12-23 2021-12-23 图像分类模型的训练方法及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN113989596B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418331A (zh) * 2020-11-26 2021-02-26 国网甘肃省电力公司电力科学研究院 一种基于聚类融合的半监督学习伪标签赋值方法
CN112507901A (zh) * 2020-12-14 2021-03-16 华南理工大学 一种基于伪标签自纠正的无监督行人重识别方法
CN113255573A (zh) * 2021-06-17 2021-08-13 成都东方天呈智能科技有限公司 基于混合簇中心标签学习的行人重识别方法和存储介质
EP3872711A1 (en) * 2020-02-28 2021-09-01 Sensyne Health Group Limited Semi-supervised machine learning method and system suitable for identification of patient subgroups in electronic healthcare records
CN113609927A (zh) * 2021-07-19 2021-11-05 上海电力大学 基于分支学习和分层伪标签的行人重识别网络训练方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11443170B2 (en) * 2016-11-15 2022-09-13 Google Llc Semi-supervised training of neural networks
US20190130220A1 (en) * 2017-10-27 2019-05-02 GM Global Technology Operations LLC Domain adaptation via class-balanced self-training with spatial priors
EP3874417A1 (en) * 2018-10-29 2021-09-08 HRL Laboratories, LLC Systems and methods for few-shot transfer learning
US11520993B2 (en) * 2019-07-24 2022-12-06 Nec Corporation Word-overlap-based clustering cross-modal retrieval
CN110555390B (zh) * 2019-08-09 2022-09-09 厦门市美亚柏科信息股份有限公司 基于半监督训练方式的行人重识别方法、装置及介质
CN111967294B (zh) * 2020-06-23 2022-05-20 南昌大学 一种无监督域自适应的行人重识别方法
CN112232439B (zh) * 2020-11-06 2024-04-05 四川云从天府人工智能科技有限公司 非监督ReID中的伪标签更新方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3872711A1 (en) * 2020-02-28 2021-09-01 Sensyne Health Group Limited Semi-supervised machine learning method and system suitable for identification of patient subgroups in electronic healthcare records
CN112418331A (zh) * 2020-11-26 2021-02-26 国网甘肃省电力公司电力科学研究院 一种基于聚类融合的半监督学习伪标签赋值方法
CN112507901A (zh) * 2020-12-14 2021-03-16 华南理工大学 一种基于伪标签自纠正的无监督行人重识别方法
CN113255573A (zh) * 2021-06-17 2021-08-13 成都东方天呈智能科技有限公司 基于混合簇中心标签学习的行人重识别方法和存储介质
CN113609927A (zh) * 2021-07-19 2021-11-05 上海电力大学 基于分支学习和分层伪标签的行人重识别网络训练方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种结合GAN和伪标签的深度半监督模型研究;杨灿;《中国科技信息》;20200901(第17期);第83-87页 *

Also Published As

Publication number Publication date
CN113989596A (zh) 2022-01-28

Similar Documents

Publication Publication Date Title
CN108427738B (zh) 一种基于深度学习的快速图像检索方法
CN108334805B (zh) 检测文档阅读顺序的方法和装置
CN110046634B (zh) 聚类结果的解释方法和装置
CN113869464B (zh) 图像分类模型的训练方法及图像分类方法
CN110909868A (zh) 基于图神经网络模型的节点表示方法和装置
CN113128536A (zh) 无监督学习方法、系统、计算机设备及可读存储介质
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN114021670A (zh) 分类模型的学习方法及终端
CN113344125A (zh) 长文本匹配识别方法、装置、电子设备及存储介质
CN111340139B (zh) 一种图像内容复杂度的判别方法及装置
CN113435308A (zh) 文本多标签分类方法、装置、设备及存储介质
CN113989596B (zh) 图像分类模型的训练方法及计算机可读存储介质
CN112269875A (zh) 文本分类方法、装置、电子设备及存储介质
CN114139658A (zh) 分类模型的训练方法及计算机可读存储介质
CN111709475A (zh) 一种基于N-grams的多标签分类方法及装置
CN115082955B (zh) 一种深度学习全局优化方法、识别方法、装置及介质
CN113705201B (zh) 基于文本的事件概率预测评估算法、电子设备及存储介质
CN115221274A (zh) 文本情感分类方法、装置、电子设备及存储介质
CN112132150B (zh) 文本串识别方法、装置及电子设备
CN114117037A (zh) 意图识别方法、装置、设备和存储介质
CN114373088A (zh) 一种图像检测模型的训练方法和相关产品
CN115937875A (zh) 文本识别方法及装置、存储介质、终端
CN113626605A (zh) 信息分类方法、装置、电子设备及可读存储介质
CN112507912A (zh) 一种识别违规图片的方法及装置
CN114118301A (zh) 分类模型的训练方法及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: 518049 Floor 25, Block A, Zhongzhou Binhai Commercial Center Phase II, No. 9285, Binhe Boulevard, Shangsha Community, Shatou Street, Futian District, Shenzhen, Guangdong

Patentee after: Shenzhen Youjia Innovation Technology Co.,Ltd.

Address before: 518049 401, building 1, Shenzhen new generation industrial park, No. 136, Zhongkang Road, Meidu community, Meilin street, Futian District, Shenzhen, Guangdong Province

Patentee before: SHENZHEN MINIEYE INNOVATION TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address