CN115294397A - 一种分类任务的后处理方法、装置、设备及存储介质 - Google Patents

一种分类任务的后处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115294397A
CN115294397A CN202210969840.3A CN202210969840A CN115294397A CN 115294397 A CN115294397 A CN 115294397A CN 202210969840 A CN202210969840 A CN 202210969840A CN 115294397 A CN115294397 A CN 115294397A
Authority
CN
China
Prior art keywords
classification
category
correlation
prediction result
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210969840.3A
Other languages
English (en)
Inventor
柳明珠
吴志伟
杨海军
陈丽珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Lvan Industry And Commerce Co ltd
Original Assignee
Guangdong Lvan Industry And Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Lvan Industry And Commerce Co ltd filed Critical Guangdong Lvan Industry And Commerce Co ltd
Priority to CN202210969840.3A priority Critical patent/CN115294397A/zh
Publication of CN115294397A publication Critical patent/CN115294397A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种分类任务的后处理方法、装置、设备及存储介质。该方法包括:使用原始分类模型获取待预测视频在各类别上的预测概率;根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果;根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果;使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果;其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。本发明实施例可以提高多标签分类任务的预测准确度。

Description

一种分类任务的后处理方法、装置、设备及存储介质
技术领域
本发明涉及计算机视觉技术领域,尤其涉及一种分类任务的后处理方法、装置、设备及存储介质。
背景技术
人体行为识别是计算机视觉领域的一个重要课题。其在行为检测、视频监控、人机交互等领域都有着广泛的应用价值。
基于机器视觉的人体行为识别是将包含人体动作的视频添加上动作类型的标签。随着大数据技术的发展,多标签数据越来越复杂,标签个数增多,而且不同标签在数据中的分布也越来越复杂。例如,TinyVIRT_V2数据集共有包括跑步、走路、站立、打招呼、搬运等26类标签,数据集中每个样本具有一个到多个标签。
对于多标签视频分类任务,常用的方法是将其转变成多个二分类问题处理,每个二分类使用3D卷积神经网络进行学习,并使用sigmoid函数输出预测概率值,然后设定一定阈值来区分正负例。由于训练集样本分布不同,各类样本数量之间相差较大,而且各类之间存在一定的相关性,所有类采用统一的单一阈值并不合理,也忽略了标签之间的相关性。
发明内容
本发明提供了一种分类任务的后处理方法、装置、设备及存储介质,以修正多标签的分类结果。
根据本发明的一方面,提供了一种分类任务的后处理方法,包括:
使用原始分类模型获取待预测视频在各类别上的预测概率;
根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果;
根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果;
使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果;其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。
根据本发明的另一方面,提供了一种分类任务的后处理装置,包括:
预测概率确定模块,用于使用原始分类模型获取待预测视频在各类别上的预测概率;
第一分类预测模块,用于根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果;
第二分类预测模块,用于根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果;
最终分类预测模块,用于使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果;其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的分类任务的后处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的分类任务的后处理方法。
本发明实施例通过在将多标签分类任务转化为多个二分类任务后,依据类别之间的相关性,依次通过相关性修正矩阵和级联模型对分类结果进行修正,大幅提升多标签分类任务的预测准确度。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一实施例提供的一种分类任务的后处理方法的流程图;
图2是根据本发明又一实施例提供的一种分类任务的后处理方法的流程图;
图3是根据本发明又一实施例提供的一种分类任务的后处理装置的结构示意图;
图4是实现本发明实施例的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明一实施例提供的一种分类任务的后处理方法的流程图,本实施例可适用于在将多标签视频分类任务转化为多个二分类问题处理后,基于多个标签之间的相关性对分类预测结果进行修正的情况,该方法可以由分类任务的后处理装置来执行,该装置可以采用硬件和/或软件的形式实现,该装置可配置于具备相应数据处理能力的电子设备中。如图1所示,该方法包括:
S110、使用原始分类模型获取待预测视频在各类别上的预测概率。
其中,待预测视频中包含人体动作,可以同时具备一个或多个标签。
具体的,将多标签视频分类任务转化为多个二分类问题处理。将训练集的标签进行one_hot编码,假设训练集总类别数n,则训练集每个样本的标签为n维向量。假设第一个样本属于n1、n2类目标行为,则将第一个样本标签向量中n1、n2位置置为1,其余位置置为0。其余样本标签按相同方式处理。将训练集送入3D卷积神经网络中进行学习,网络的输出使用sigmoid函数转换为样本属于各类的概率,并使用BEC LOSS作为模型的损失函数。
使用训练好的原始分类模型对测试集进行预测,假设测试集总样本数为q,则经过原始分类模型预测后,可以输出矩阵形状为q×n的预测概率值矩阵。
S120、根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果。
具体的,在原始分类模型的验证集上根据F1值来为每类搜寻一个最佳阈值区间,输出概率值在阈值区间内为正例,在阈值区间外为负例,从而得到第一分类预测结果。
可选的,所述根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例之前,还包括:
构建阈值区间边界候选数组,并将所述候选数组内的元素作为阈值区间的候选边界;在验证集上计算由各候选边界构成的候选阈值区间的F1值,并将F1值最高的候选阈值区间作为当前类别的最佳阈值区间。
具体的,由于训练集样本分布不同,各类样本数相差较大,而且各类之间存在一定的相关性,常规做法所有类采用统一的单一阈值来区分正负例并不合理。因此,本发明在验证集上以F1值为标准为每类搜寻一个最佳阈值区间,输出概率值在阈值区间内的为正例,在阈值区间外的为负例。假设第m类输出的概率值为pm,搜寻到的阈值区间为[tm1,tm2],则最终的预测结果为ym为:
Figure BDA0003796130120000051
根据预测结果ym计算查准率P、查全率R、F1值。
Figure BDA0003796130120000052
Figure BDA0003796130120000053
Figure BDA0003796130120000061
其中,TP为验证集中标签为1,预测也为1的样本数量;FP为验证集中标签0,预测为1的样本数量;FN为验证集中标签为1,预测为0的样本数量。
创建一个数值范围为0~1,间隔为0.01的区间下边界候选数组,以数组内的每个元素作为各候选阈值区间的不同下界,1作为各候选阈值区间的相同上界,在验证集上按照F1值计算公式计算所有候选阈值区间的F1值,取F1值最高的候选阈值区间的下界作为第m类的最佳阈值区间下界tm1。创建一个数值范围为tm1+0.2~1,间隔为0.01的区间上边界候选数组,以数组内的每个元素作为各候选阈值区间的不同上界,tm1作为各候选阈值区间的相同下界,在验证集上按照F1值计算公式计算所有候选阈值区间的F1值,取F1值最高的候选阈值区间作为第m类的最佳阈值区间[tm1,tm2],其他类最佳阈值区间按照相同方式进行寻找。通过阈值区间搜索,会得到n个类别的最佳阈值区间。
使用搜寻到的各类别最佳阈值区间,将测试集预测概率值转换为正负例,得到形状为q×n的测试集预测结果,即第一分类预测结果。
S130、根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果。
具体的,对待预测视频的预测,其所属类别之间通常是存在一定关联。将对于多标签视频分类任务转变成多个二分类问题处理虽然能降低分类上的复杂度,但这种降低处理复杂度的处理方式会忽略标签之间的相关性。为此,从训练集中获取各个类别之间真实的相关性数据,根据相关性数据生成相关性修正矩阵,相关性修正矩阵中记录了各个类别与其他类别之间相关度。修正后的第二分类预测结果相比第一分类预测结果,补充了由于多标签分类任务转化为多个二分类任务缺失的类别之间的相关性信息。
可选的,所述根据训练集中各类别之间的相关性确定相关性修正矩阵,包括:
根据训练集中各样本的所属标签生成类别相关数量统计矩阵;对所述类别相关数量统计矩阵进行归一化处理,得到相关性系数矩阵;将所述相关性系数矩阵中系数为0的元素赋值为特定值,得到相关性修正矩阵;所述特征值为负数。
具体的,根据训练集中各样本的所属标签生成类别相关数量统计矩阵,类别相关数量统计矩阵中记载了训练集中任意两个类别之间的重叠样本数量。对类别相关数量统计矩阵进行归一化处理,得到量化任意两个类别之间相关性的相关性系数,并生成由相关性系数组成的相关性系数矩阵。相关性系数的大小表征了两个类别之间的相关度,通常以0-1进行表示,相关性系数的数值越大,说明两个类别之间相关度越高;反之,相关性系数的数值越小,说明两个类别之间相关度越低。可以将相关性系数为0的矩阵元素赋值为负数(例如-1),以便后续的矩阵运算和相关性判断。
可选的,所述根据训练集中各样本的所属标签生成类别相关数量统计矩阵包括:
获取训练集中任一标签下各样本所属的其他标签,并确定该标签与其他标签的重叠样本数量;根据各标签与其他标签的重叠样本数量,生成类别相关数量统计矩阵。
具体的,假设多标签分类的类别总共有n类,则类别相关数量统计矩阵的形状为n×n,如下所示。
Figure BDA0003796130120000071
矩阵中第m列为训练集中当第m类标签存在时,其余各类标签同时存在的重叠样本数量,即同时存在两个标签的样本数量。例如,Nmm为训练集中第m类标签存在的样本数量,Nm1为训练集中第m类标签存在时,第1类标签同时存在的重叠样本数量,其余元素以此类推。
对上述矩阵做归一化处理,第m列每个元素除以Nmm。得到的归一化矩阵中第m列每个元素表示第m类与其余类的相关性系数,其中第m列m行为1,第m列其余行介于0-1之间,等于0表示完全不相关,等于1表示完全相关,大于0小于1表示部分相关,值越大表示相关性越大。将矩阵中等于0的元素修改为特定数值,例如-1,即将完全不相关的相关性系数设为-1,得到最终的相关性修正矩阵。
Figure BDA0003796130120000081
(矩阵中等于0的元素修改为-1)将第一分类预测结果与相关性修正矩阵相乘,得到中间矩阵,将中间矩阵中大于等于0的元素设为1,小于0的元素设为0,从而得到相关性修正矩阵修正后的第二分类预测结果Yq×n
Figure BDA0003796130120000082
(矩阵中等于0的元素修改为-1)
(矩阵中≧0的元素设为1,<0的元素设为0)
S140、使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果。
其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。
具体的,级联模型在训练时以从相关性修正矩阵得到的级联分类类别为标签进行重新训练,由于级联分类类别的类别总数量小于原始分类的类别类别总数量,类别学习的更充分,级联模型的分类准确度比原始分类模型的分类准确度要高。通过级联模型的预测结果,对所述第二分类预测结果进行修正,并将该修正结果作为待预测视频最终的分类预测结果。
本发明实施例通过在将多标签分类任务转化为多个二分类任务后,依据类别之间的相关性,依次通过相关性修正矩阵和级联模型对分类结果进行修正,大幅提升多标签分类任务的预测准确度。
图2为本发明又一实施例提供的一种分类任务的后处理方法的流程图,本实施例在上述实施例的基础上进行了优化改进。如图2所示,该方法包括:
S210、使用原始分类模型获取待预测视频在各类别上的预测概率。
S220、根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果。
S230、根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果。
S240、获取相关性修正矩阵中最小元素对应的第一类别和第二类别;以所述第一类别和第二类别对原始分类类别进行聚类,转换为级联分类类别;基于级联分类类别使用原始分类模型进行重新训练,并将重新训练完成的模型作为级联模型。
具体的,取出相关性修正矩阵中最小元素所对应的两个类别n1(第一类别)、n2(第二类别),如果最小元素有多个则随机抽取一个,以这两个类别先进行聚类,将其余类别与n1的相关性大于0.5的归为k1组,与n2的相关性大于0.5的归为k2组,如果某个类与两个类别的相关性同时大于0.5,则将该类归为相关性较大的组。对于剩余类别,随机抽取一个,将剩余类别中与其相关性大于0.5的归为1组,对于剩余类别以此类推,直到没有类别剩下,最终将总类别n划分成k组,即将原始分类类别聚类成级联分类类别。使用3D卷积神经网络重新训练k分类模型(即级联模型)。
S250、通过级联模型获取所述待预测视频的级联分类类别预测结果;将所述级联分类类别预测结果和第二分类预测结果融合,得到待预测视频的最终分类预测结果。
具体的,在验证集上以F1为标准搜寻k类最佳阈值区间,然后使用训练好的k分类模型对待预测视频进行预测,并用搜寻到的k类最佳阈值区间区分正负例,得到k分类模型的级联分类类别预测结果。k类最佳阈值区间与上述n类最佳阈值区间的搜寻过程相同,此处不过多赘述。
Figure BDA0003796130120000101
将k分类的级联分类类别预测结果Yq×k转变为Y′q×n,具体过程如下:首先形成q*n,元素全部为0的矩阵,假设第一个样本k分类预测结果为k1,k1组内包括n1、n3、n5三个类别,则将q*n矩阵中第1行第1、3、5列元素设为1,其余样本以此类推。将级联分类类别预测结果Y′q×n与相关性修正矩阵修正得到的第二分类预测结果Yq×n对应位置相乘,得到待预测视频的最终分类预测结果。
Yq×n=Yq×n·Y′q×n
可选的,所述原始分类模型和级联模型的神经网络结构相同,所述原始分类模型的原始分类类别数量大于所述级联模型的级联分类类别数量。
具体的,级联模型与原始分类模型均是对待预测视频进行处理,若两者的神经网络结构保持一致,无需重新构建新的神经网络结构。同时,由于k分类中样本数增多,类别学习的更充分,k分类的准确度要比n分类更高。
本发明实施例通过根据相关性修正矩阵,将所有标签分成k组(k小于总类别数n),使用原始分类模型(3D卷积神经网络)重新进行训练,得到k分类的结果,将k分类结果和n分类结果进行融合,可进一步修正多标签的分类结果。
图3为本发明又一实施例提供的一种分类任务的后处理装置的结构示意图。如图3所示,该装置包括:
预测概率确定模块310,用于使用原始分类模型获取待预测视频在各类别上的预测概率;
第一分类预测模块320,用于根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果;
第二分类预测模块330,用于根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果;
最终分类预测模块340,用于使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果;其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。
本发明实施例所提供的分类任务的后处理装置可执行本发明任意实施例所提供的分类任务的后处理方法,具备执行方法相应的功能模块和有益效果
可选的,第二分类预测模块330包括:
统计矩阵生成单元,用于根据训练集中各样本的所属标签生成类别相关数量统计矩阵;
系数矩阵生成单元,用于对所述类别相关数量统计矩阵进行归一化处理,得到相关性系数矩阵;
矩阵元素赋值单元,用于将所述相关性系数矩阵中系数为0的元素赋值为特定值,得到相关性修正矩阵;所述特征值为负数。
可选的,所述统计矩阵生成单元包括:
重叠样本获取子单元,用于获取训练集中任一标签下各样本所属的其他标签,并确定该标签与其他标签的重叠样本数量;
统计矩阵生成子单元,用于根据各标签与其他标签的重叠样本数量,生成类别相关数量统计矩阵。
可选的,所述装置还包括:
候选边界确定单元,用于构建阈值区间边界候选数组,并将所述候选数组内的元素作为阈值区间的候选边界;
阈值区间确定单元,用于在验证集上计算由各候选边界构成的候选阈值区间的F1值,并将F1值最高的候选阈值区间作为当前类别的最佳阈值区间。
可选的,所述装置还包括:
聚类基准获取模块,用于获取相关性修正矩阵中最小元素对应的第一类别和第二类别;
分类类别聚类模块,用于以所述第一类别和第二类别为中心对原始分类模型的原始分类类别进行聚类,转换为级联分类类别;
级联模型训练模块,用于基于级联分类类别使用原始分类模型重新进行训练,并将重新训练完成的模型作为级联模型。
可选的,所述最终分类预测模块340包括:
级联分类预测单元,用于通过级联模型获取所述待预测视频的级联分类类别预测结果;
预测结果融合单元,用于将所述级联分类类别预测结果和第二分类预测结果融合,得到待预测视频的最终分类预测结果。
可选的,所述原始分类模型和级联模型的神经网络结构相同,所述原始分类模型的原始分类类别数量大于所述级联模型的级联分类类别数量。
进一步说明的分类任务的后处理装置也可执行本发明任意实施例所提供的分类任务的后处理方法,具备执行方法相应的功能模块和有益效果。
图4示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备40包括至少一个处理器41,以及与至少一个处理器41通信连接的存储器,如只读存储器(ROM)42、随机访问存储器(RAM)43等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序,来执行各种适当的动作和处理。在RAM 43中,还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。
电子设备40中的多个部件连接至I/O接口45,包括:输入单元46,例如键盘、鼠标等;输出单元47,例如各种类型的显示器、扬声器等;存储单元48,例如磁盘、光盘等;以及通信单元49,例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理,例如分类任务的后处理方法。
在一些实施例中,分类任务的后处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元48。在一些实施例中,计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时,可以执行上文描述的分类任务的后处理方法的一个或多个步骤。备选地,在其他实施例中,处理器41可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行分类任务的后处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种分类任务的后处理方法,其特征在于,包括:
使用原始分类模型获取待预测视频在各类别上的预测概率;
根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果;
根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果;
使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果;其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。
2.根据权利要求1所述的方法,其特征在于,所述根据训练集中各类别之间的相关性确定相关性修正矩阵,包括:
根据训练集中各样本的所属标签生成类别相关数量统计矩阵;
对所述类别相关数量统计矩阵进行归一化处理,得到相关性系数矩阵;
将所述相关性系数矩阵中系数为0的元素赋值为特定值,得到相关性修正矩阵;所述特征值为负数。
3.根据权利要求2所述的方法,其特征在于,所述根据训练集中各样本的所属标签生成类别相关数量统计矩阵包括:
获取训练集中任一标签下各样本所属的其他标签,并确定该标签与其他标签的重叠样本数量;
根据各标签与其他标签的重叠样本数量,生成类别相关数量统计矩阵。
4.根据权利要求1所述的方法,其特征在于,所述根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例之前,还包括:
构建阈值区间边界候选数组,并将所述候选数组内的元素作为阈值区间的候选边界;
在验证集上计算由各候选边界构成的候选阈值区间的F1值,并将F1值最高的候选阈值区间作为当前类别的最佳阈值区间。
5.根据权利要求1所述的方法,其特征在于,所述使用级联模型对所述第二分类预测结果进行修正之前,还包括:
获取相关性修正矩阵中最小元素对应的第一类别和第二类别;
以所述第一类别和第二类别为中心对原始分类模型的原始分类类别进行聚类,转换为级联分类类别;
基于级联分类类别使用原始分类模型重新进行训练,并将重新训练完成的模型作为级联模型。
6.根据权利要求1所述的方法,其特征在于,所述使用级联模型对所述第二分类预测结果进行修正,得到待预测视频的最终分类预测结果包括:
通过级联模型获取所述待预测视频的级联分类类别预测结果;
将所述级联分类类别预测结果和第二分类预测结果融合,得到待预测视频的最终分类预测结果。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述原始分类模型和级联模型的神经网络结构相同,所述原始分类模型的原始分类类别数量大于所述级联模型的级联分类类别数量。
8.一种分类任务的后处理装置,其特征在于,包括:
预测概率确定模块,用于使用原始分类模型获取待预测视频在各类别上的预测概率;
第一分类预测模块,用于根据各类别的正负例最佳阈值区间将所述待预测视频在各类别上的预测概率转换为正负例,得到第一分类预测结果;
第二分类预测模块,用于根据训练集中各类别之间的相关性确定相关性修正矩阵,并根据所述相关性修正矩阵对所述第一分类预测结果进行修正得到第二分类预测结果;
最终分类预测模块,用于使用级联模型对所述第二分类预测结果进行修正,得到所述待预测视频的最终分类预测结果;其中,所述级联模型中的类别是根据所述相关性修正矩阵得到。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的分类任务的后处理方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的分类任务的后处理方法。
CN202210969840.3A 2022-08-12 2022-08-12 一种分类任务的后处理方法、装置、设备及存储介质 Pending CN115294397A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210969840.3A CN115294397A (zh) 2022-08-12 2022-08-12 一种分类任务的后处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210969840.3A CN115294397A (zh) 2022-08-12 2022-08-12 一种分类任务的后处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115294397A true CN115294397A (zh) 2022-11-04

Family

ID=83830705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210969840.3A Pending CN115294397A (zh) 2022-08-12 2022-08-12 一种分类任务的后处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115294397A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152539A (zh) * 2023-10-27 2023-12-01 浙江由由科技有限公司 基于降维特征机器校验的生鲜商品分类修正方法
CN117648612A (zh) * 2024-01-30 2024-03-05 上海移视网络科技有限公司 并联电池组故障检测方法、装置、电子设备和存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117152539A (zh) * 2023-10-27 2023-12-01 浙江由由科技有限公司 基于降维特征机器校验的生鲜商品分类修正方法
CN117152539B (zh) * 2023-10-27 2024-01-26 浙江由由科技有限公司 基于降维特征机器校验的生鲜商品分类修正方法
CN117648612A (zh) * 2024-01-30 2024-03-05 上海移视网络科技有限公司 并联电池组故障检测方法、装置、电子设备和存储介质
CN117648612B (zh) * 2024-01-30 2024-04-12 上海移视网络科技有限公司 并联电池组故障检测方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN110909165B (zh) 数据处理方法、装置、介质及电子设备
CN115294397A (zh) 一种分类任务的后处理方法、装置、设备及存储介质
CN109948735B (zh) 一种多标签分类方法、系统、装置及存储介质
CN111008640A (zh) 图像识别模型训练及图像识别方法、装置、终端及介质
CN115114439B (zh) 多任务模型推理、多任务信息处理的方法和装置
CN115080749B (zh) 一种基于自监督训练的弱监督文本分类方法、系统和装置
CN112560461A (zh) 新闻线索的生成方法、装置、电子设备及存储介质
CN113642727B (zh) 神经网络模型的训练方法和多媒体信息的处理方法、装置
CN114037059A (zh) 预训练模型、模型的生成方法、数据处理方法及装置
CN115186738B (zh) 模型训练方法、装置和存储介质
CN114444514B (zh) 语义匹配模型训练、语义匹配方法及相关装置
CN114610953A (zh) 一种数据分类方法、装置、设备及存储介质
CN115600607A (zh) 一种日志检测方法、装置、电子设备及介质
CN115080745A (zh) 基于人工智能的多场景文本分类方法、装置、设备及介质
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
CN114882315A (zh) 样本生成方法、模型训练方法、装置、设备及介质
CN114611609A (zh) 一种图网络模型节点分类方法、装置、设备及存储介质
CN112463964A (zh) 文本分类及模型训练方法、装置、设备及存储介质
CN110879821A (zh) 评分卡模型衍生标签生成方法、装置、设备及存储介质
CN115471893B (zh) 训练人脸识别模型、人脸识别的方法和装置
CN116662415B (zh) 基于数据挖掘的智能匹配方法及系统
CN116977021B (zh) 基于大数据的系统对接自动推单方法
CN114037058B (zh) 预训练模型的生成方法、装置、电子设备以及存储介质
CN117807287A (zh) 标签融合方法、装置、电子设备以及存储介质
CN116628491A (zh) 一种二分类模型的训练方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination