CN110929771B - 图像样本分类方法及装置、电子设备、可读存储介质 - Google Patents
图像样本分类方法及装置、电子设备、可读存储介质 Download PDFInfo
- Publication number
- CN110929771B CN110929771B CN201911119302.XA CN201911119302A CN110929771B CN 110929771 B CN110929771 B CN 110929771B CN 201911119302 A CN201911119302 A CN 201911119302A CN 110929771 B CN110929771 B CN 110929771B
- Authority
- CN
- China
- Prior art keywords
- classification
- cluster
- clustering
- image
- image sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本公开关于一种图像样本分类方法及装置、电子设备、可读存储介质。该方法包括:获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。本实施例中利用历史聚类的对照分类集合对初始分类集合进行调整,可以使目标分类集合与对照分类集合中各聚类簇形成映射关系,从而使相同图像样本在本次聚类和历史聚类中具有相同的分类标识,避免出现分类漂移现象,有利于提升使用体验。
Description
技术领域
本公开涉及深度学习技术领域,尤其涉及一种图像样本分类方法及装置、电子设备、可读存储介质。
背景技术
目前,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。以深度学习中的卷积神经网络(CNN)为例,其具有较强的拟合能力和端到端的全局优化能力,能够大幅提升视频图像分类的预测精度。例如,在一个应用场景,卷积神经网络对一帧图像进行类型预测时,可以给出图像属于图像样本中标签的概率,如使用一个包括“猫”和“狗”的样本集训练的卷积神经网络,当对一个“猴”的图像进行预测时,只能给出图像属于“猫”或者“狗”的概率。
实际应用中,用户原创内容(User Generated Content,UGC)平台的用户会上传各种各样的视频或图像的数据,其中可能会包括不属于预先定义的所有标签的数据,例如上述示例中的“猴”的图像。为此,相关技术中会采用聚类方式对这些数据进行区分,即通过卷积神经网络提取各数据的特征,然后通过聚类方式,实现更加细粒度的刻画,得到更多个类别。
然而,相关技术中聚类过程是无监督的,在聚类模型初始化后,相同的数据在不同聚类过程中可能会被划分到不同的聚类中心,即相同的数据在不同的聚类过程具有不同的分类结果,出现类似“漂移”现象,影响使用体验。
发明内容
本公开提供一种图像样本分类方法及装置、电子设备、可读存储介质,以至少解决相关技术中因聚类模型初始化导致相同数据在不同聚类过程出现的分类结果不同的问题。
本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像样本分类方法,包括:
获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;
基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;
根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。
可选地,获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合,包括:
利用预先设置的预测分类模型获取所述待分类的图像样本中各图像样本的图像特征f和预测分类p;
将所述待分类的图像样本的图像特征f输入到训练后的聚类模型,由所述聚类模型确定出所述各图像样本的分类标识c;
基于所述分类标识c和所述预测分类p合并满足设定条件的聚类簇,得到m个聚类簇;
获取所述m个聚类簇的中心点特征cluster,得到包括m个聚类簇的所述初始分类集合。
可选地,所述设定条件是指任意两个干净的聚类簇且具有相同分类标识c的聚类簇;其中,
所述干净的聚类簇,是指在一个聚类簇中,有超过设定比例的图像样本具有相同的预测分类p;
所述具有相同分类标识c的聚类簇,是指两个干净的聚类簇中超过设定比例的图像样本具有相同的预测分类p。
可选地,所述m个聚类簇中各聚类簇采用超过设定比例的图像样本所具有的预测分类p作为其分类名称。
可选地,获取所述m个聚类簇的中心点特征cluster,包括:
其中,k表示中心点特征cluster的第k个维度,c表示聚类分类的样本集合,i表示一个图像样本。
可选地,基于所述对照分类集合调整所述初始分类集合中的各聚类簇,包括:
对比所述初始分类集合和所述对照分类集合中各聚类中心的标识;
若标识相同,则合并具有相同标识的聚类簇;若不同,则计算所述初始分类集合和所述对照分类集合中具有不同标识的聚类中心之间的距离值;
利用所述对照分类集合中聚类中心的标识替代所述初始分类集合中聚类中心的标识;参与替代的两个聚类中心的距离值在所述初始分类集合和所述对照分类集合中聚类中心之间的距离值中最小。
可选地,所述距离值包括以下至少一种:欧氏距离和余弦距离。
根据本公开实施例的第二方面,提供一种图像样本分类装置,包括:
分类集合获取单元,被配置为执行获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;
目标集合获取单元,被配置为执行基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;
分类标识确定单元,被配置为执行根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。
可选地,所述分类集合获取单元包括:
图像特征获取模块,被配置为执行利用预先设置的预测分类模型获取所述待分类的图像样本中各图像样本的图像特征f和预测分类p;
分类标识确定模块,被配置为执行将所述待分类的图像样本的图像特征f输入到训练后的聚类模型,由所述聚类模型确定出所述各图像样本的分类标识c;
聚类簇获取模块,被配置为执行基于所述分类标识c和所述预测分类p合并满足设定条件的聚类簇,得到m个聚类簇;
初始集合获取模块,被配置为执行获取所述m个聚类簇的中心点特征cluster,得到包括m个聚类簇的所述初始分类集合。
可选地,所述设定条件是指任意两个干净的聚类簇且具有相同分类标识c的聚类簇;其中,
所述干净的聚类簇,是指在一个聚类簇中,有超过设定比例的图像样本具有相同的预测分类p;
所述具有相同分类标识c的聚类簇,是指两个干净的聚类簇中超过设定比例的图像样本具有相同的预测分类p。
可选地,所述m个聚类簇中各聚类簇采用超过设定比例的图像样本所具有的预测分类p作为其分类名称。
可选地,获取所述m个聚类簇的中心点特征cluster,包括:
其中,k表示中心点特征cluster的第k个维度,c表示聚类分类的样本集合,i表示一个图像样本。
可选地,所述目标集合获取单元包括:
标识对比模块,被配置为执行对比所述初始分类集合和所述对照分类集合中各聚类中心的标识;
聚类簇合并模块,被配置为执行在标识相同时,合并具有相同标识的聚类簇;
距离值计算模块,被配置为执行在标识不同时,计算所述初始分类集合和所述对照分类集合中具有不同标识的聚类中心之间的距离值;
标识替代模块,被配置为执行利用所述对照分类集合中聚类中心的标识替代所述初始分类集合中聚类中心的标识;参与替代的两个聚类中心的距离值在所述初始分类集合和所述对照分类集合中聚类中心之间的距离值中最小。
可选地,所述距离值包括以下至少一种:欧氏距离和余弦距离。
根据本公开实施例的第三方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述存储器中的可执行指令,以实现如第一方面所述方法的步骤。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由处理器执行时能够执行如第一方面所述方法的步骤。
根据本公开实施例的第五方面,提供一种应用程序,当该应用程序由电子设备的处理器执行时,使得所述电子设备能够执行如第一方面所述方法的步骤,以获取相同的技术效果。
本公开的实施例提供的技术方案至少带来以下有益效果:
本实施例中获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。本实施例中利用历史聚类的对照分类集合对初始分类集合进行调整,可以使目标分类集合与对照分类集合中各聚类簇形成映射关系,从而使相同图像样本在本次聚类和历史聚类中具有相同的分类标识,避免出现分类漂移现象,有利于提升使用体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种图像样本分类方法的流程图。
图2是根据一示例性实施例示出的另一种图像样本分类方法的流程图。
图3是根据一示例性实施例示出的一种图像样本分类方法的流程图。
图4~图6是根据一示例性实施例示出的一种图像样本分类装置的框图。
图7是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
目前,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。以深度学习中的卷积神经网络(CNN)为例,其具有较强的拟合能力和端到端的全局优化能力,能够大幅提升视频图像分类的预测精度。例如,在一个应用场景,卷积神经网络对一帧图像进行类型预测时,可以给出图像属于训练样本中标签的概率,如使用一个包括“猫”和“狗”的样本集训练的卷积神经网络,当对一个“猴”的图像进行预测时,只能给出图像属于“猫”或者“狗”的概率。
实际应用中,用户原创内容(User Generated Content,UGC)平台的用户会上传各种各样的视频或图像的数据,其中可能会包括不属于预先定义的所有标签的数据,例如上述示例中的“猴”的图像。为此,相关技术中会采用聚类方式对这些数据进行区分,即通过卷积神经网络提取各数据的特征,然后通过聚类方式,实现更加细粒度的刻画,得到更多个类别。
然而,相关技术中聚类过程是无监督的,在聚类模型初始化后,相同的数据在不同聚类过程中可能会被划分到不同的聚类中心,即相同的数据在不同的聚类过程具有不同的分类结果,出现类似“漂移”现象,影响使用体验。
为此,本公开实施例提供了一种图像样本分类方法,图1是根据一示例性实施例示出的一种图像样本分类方法,可以适用于电子设备,其中,电子设备可以包括智能手机、平板电脑等终端,可以是服务器,还可以是由终端和服务器构成的电子系统,在此不作限定。并且,本实施例提供的一种图像样本分类方法适于图像样本分类、视频内容识别等场景,在此不作限定。参见图1,一种图像样本分类方法,包括步骤101~步骤103,其中:
在步骤101中,获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合。
本实施例中,电子设备可以获取待分类的图像样本,其中待分类的图像样本的数量可以根据具体场景进行设置,如100~1000份图片。需要说明的是,待分类的图像样本可以存储在指定位置,如本地存储器、服务器、云端等,在此不作限定。
然后,电子设备可以基于待分类的图像样本进行本次聚类,参见图2,电子设备可以先获取预先设置的预测分类模型。以图像分类为例,该预测分类模型可以是一个识别设定数量(如k)分类的卷积神经网络模型,技术人员可以根据具体场景选择合适的预测分类模型,在能够获取样本的特征和预测分类的情况下,相应的分类模型落入本公开的保护范围。这样,电子设备可以利用预先设置的预测分类模型获取待分类的图像样本中各图像样本的图像特征f(featuresi)和预测分类p(predictionsi)(对应图2中步骤201)。在一示例中,电子设备可以将待分类的图像样本中的任意一个图像样本i表示为二元组(featuresi,predictionsi)。
之后,电子设备可以将待分类的图像样本的图像特征f输入到训练后的聚类模型,由该聚类模型确定出待分类的图像样本中各图像样本的分类标识(cluster)(对应图2中步骤202)。其中,聚类模型可以根据具体场景进行选择,例如kmeans聚类模型。
以聚类模型使用kmeans聚类模型为例,在使用该kmeans聚类模型之前,利用图像样本的图像特征训练kmeans聚类模型。在计算各图像样本之间的距离dis(centeri,centerj)时,本实施例中采用余弦距离来表示,即cosine(centeri,centerj)。其中该余弦距离可以参考相关技术中的余弦公式,在此不再详述。当然,在一些场景中各图像样本之间的距离还可以采用欧式距离来表示,在此不作限定。在聚类过程中,考虑到会合并聚类簇以及可能会合并出现“新”的聚类簇,即新类别,本实施例中,可以预先设置kmeans聚类模型的聚类中心的个数n,其中n大于k。在一示例中,n可以取值为4k,即聚类中心个数是分类类别个数的4倍。
在一示例中,聚类模型在确定出待分类的图像样本中各图像样本的分类标识c后,电子设备可以将任意一个待分类的图像样本i表示为三元组(featuresi,predictionsi,clusteri)。
继续参见图2,电子设备可以基于分类标识c和预测分类p合并满足设定条件的聚类簇,得到m个聚类簇(对应图2中步骤203)。其中,设定条件是指任意两个干净的聚类簇且具有相同分类标识c的聚类簇。其中,
干净的聚类簇,是指在一个聚类簇中,有超过设定比例的图像样本具有相同的预测分类p。即,在一个聚类簇中,有超过设定比例α(如α大于0.5)的图像样本被预测到了同一个分类predictions,即为干净聚类簇。例如α=0.95,某个聚类簇Ω包括1000个图像样本,其中990个图像样本被预测成了分类“猫”,剩余的10个图像样本被预测成分类“狗”,这时“猫”占此聚类簇的比例为0.99>α(=0.95),则认为此聚类簇是“干净”的。
具有相同分类标识c的聚类簇,是指两个干净的聚类簇中超过设定比例的图像样本具有相同的预测分类p。例如,两个干净的聚类簇Ψ、Ω,它们中大于设定比例α的图像样本分类相同,如都是“猫”,则把Ψ、Ω进行合并。
本实施例中,电子设备可以将合并后的聚类簇中每个图像样本i可以表示为clear_xxxi,其中,xxx表示分类名称,例如“xxx”可以为“猫猫猫”,即通过为图像样本i标记分类名称,可以使该图像样本i的分类具有明确的语义。与输出分类predictions相比,对图像样本i标记分类名称可以得到具有明确语义的标记,提高输出分类的准确度。
继续参见图2,电子设备可以获取m个聚类簇的中心点特征cluster,得到包括m个聚类簇的所述初始分类集合(对应图2中步骤204)。其中,聚类簇的聚类中心的中心点特征cluster可以通过以下公式计算:
其中,k表示中心点特征cluster的第k个维度,c表示聚类分类的样本集合,i表示一个图像样本。
在一实施例中,电子设备可以计算出合并后的聚类簇的中心点特征以及剩余(即未参与未合并)的聚类簇的中心点特征这样合并后的聚类簇和剩余的聚类簇的数量可以为m(m<n)个,m个聚类簇的中心点特征可以形成初始分类集合。可理解的是,本实施例中聚类簇的数量(m)会大于原先聚类簇的数量(k),可以用更小的粒度来分类图像样本,有利于丰富图像样本的分类,从而更适合用户原始内容平台的分类场景。
另外,电子设备可以获取本次聚类之前的历史聚类的对照分类集合,该对照分类集合可以采用初始分类集合的方法形成,具体步骤可以参考上述各实施例的内容,在此不再赘述。需要说明的是,对照分类集合可以是本次聚类的前一次(即离本次聚类最近的一次聚类)的聚类结果,还可以是本次聚类之前的第一次聚类(即所有聚类的第一次聚类)的聚类结果,也可以是前一次和第一次聚类之间的任意一次聚类的聚类结果,技术人员可以根据具体场景进行选择,本公开不作限定。
在步骤102中,基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合。
本实施例中,电子设备可以在获取到对照分类集合和初始分类集合之后,对初始分类集合进行调整。参见图3,电子设备可以获取初始分类集合和对照分类集合中各聚类中心的标识,并对比初始分类集合和对照分类集合中各聚类中心的标识(对应图3中步骤301)。若对比结果表示标识相同,电子设备可以合并具有相同标识的聚类簇(对应图3中步骤302)。若对比结果表示标识不同,电子设备可以计算初始分类集合和对照分类集合中具有不同标识的聚类中心之间的距离值(对应图3中步骤303)。本示例中,电子设备可以采用余弦距离来计算两个聚类中心之间的距离值,可参见kmeans聚类模型的两个聚类中心之间距离的计算,在此不再赘述。
之后,电子设备可以利用对照分类集合中聚类中心的标识替代初始分类集合中聚类中心的标识;参与替代的两个聚类中心的距离值在初始分类集合和对照分类集合中聚类中心之间的距离值中最小(对应图3中步骤304)。
这样,电子设备可以基于对照分类集合对初始分类集合进行调整,如聚类簇合并和/或标识替代,可以使初始分类集合与对照分类集合形成映射关系,从而得到目标分类集合。可理解的是,本实施例中通过对初始分类集合调整,可以使初始分类集合与对照分类集合形成映射关系,进一步地,目标分类集合也会与对照分类集合形成映射关系,即每一次聚类所得到的目标分类集合会与之前的对照分类集合形成映射关系。换言之,每次聚类过程中,目标分类集合中各图像样本均可以在对照分类中找到与其存在映射关系的分类,避免聚类中心出现“漂移”而无法预测分类的现象,有利于提升后续分类的准确度。
在步骤103中,根据所述目标分类集合确定所述待分类的图像样本中各图像样本的分类标识。
本实施例中,电子设备可以根据目标分类集合确定出待分类的图像样本中各图像样本的分类标识。可理解的是,本实施例中部分待分类的图像样本的分类标识有明确的语义,预测成功率大大提高。
至此,本实施例中获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。本实施例中利用历史聚类的对照分类集合对初始分类集合进行调整,可以使目标分类集合与对照分类集合中各聚类簇形成映射关系,从而使相同图像样本在本次聚类和历史聚类中具有相同的分类标识,避免出现分类漂移现象,有利于提升使用体验。
下面以图像样本分类为例,描述一种图像样本分类方法对待分类图像进行分类的步骤。
电子设备获取待分类的图像,利用预先设置的预测分类模型(modelnm)提取各待分类图像的图像特征features和预测分类predictions,这样每个待分类的图像可以采用二元组(features,predictions)来表示。
然后,电子设备可以将各待分类图像的图像特征features输入到已训练好的Kmeans算法,对全部待分类的图像进行聚类,得到多个聚类簇cluster。每个聚类簇具有一个聚类中心,可以得到每个聚类簇的中心点特征cluster,另外采用不同的分类标识来区分各聚类簇。即Kmeans算法可以确定出各待分类图像的分类标识,此时各待分类图像可以采用一个三元组(features,predictions,cluster)来表示。
之后,电子设备可以对满足条件的聚类簇cluster进行合并,包括:合并任意两个干净的聚类簇且具有相同分类标识c的聚类簇。对于合并后的聚类簇cluster中的各待分类图像i可采用分类标识clear_xxxi表示,其中xxx表示分类名称,例如“xxx”可以为“猫猫猫”,具有明确的语义。同时,电子设备可以计算出合并之后的聚类簇的中心点特征以及计算剩余聚类簇的中心特征从而得到m个聚类簇的中心点特征。这样,电子设备可以得到待分类图像的初始分类集合。
最后,电子设备还可以获取对照分类集合,该对照分类集合为本次聚类之前获得的目标分类集合,计算初始分类集合和对照分类集合中各聚类簇的中心点之间的距离,并使用距离最小的聚类簇标号来表示初始分类集合中待分类图像的分类标识,这样可以对具有相同分类标识的聚类簇进行合并,得到新的聚类簇,最终得到待分类图像所属的目标分类集合。根据目标分类集合和聚类簇的对应关系,可以得到各待分类图像的分类标识。
需要说明的是,待分类图像中由于一部分图像的分类标识具有明确的语义,可以提升所分类的准确度。并且,各待分类图像的分类与历史图像的分类具有关联,可以保证分类的稳定性。
在本公开实施例提供的一种图像样本分类方法的基础上,本实施例还提供了一种图像样本分类装置,图4是根据一示例性实施例示出的一种图像样本分类装置的框图。参见图4,一种图像样本分类装置400,包括:
分类集合获取单元401,被配置为执行获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;
目标集合获取单元402,被配置为执行基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;
分类标识确定单元403,被配置为执行根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。
图5是根据一示例性实施例示出的另一种图像样本分类装置的框图,在图4所示的一种图像样本分类装置的基础上,参见图5,分类集合获取单元401包括:
图像特征获取模块501,被配置为执行利用预先设置的预测分类模型获取所述待分类的图像样本中各图像样本的图像特征f和预测分类p;
分类标识确定模块502,被配置为执行将所述待分类的图像样本的图像特征f输入到训练后的聚类模型,由所述聚类模型确定出所述待分类的图像样本中各图像样本的分类标识c;
聚类簇获取模块503,被配置为执行基于所述分类标识c和所述预测分类p合并满足设定条件的聚类簇,得到m个聚类簇;
初始集合获取模块504,被配置为执行获取所述m个聚类簇的中心点特征cluster,得到包括m个聚类簇的所述初始分类集合。
在一实施例中,所述设定条件是指任意两个干净的聚类簇且具有相同分类标识c的聚类簇;其中,
所述干净的聚类簇,是指在一个聚类簇中,有超过设定比例的图像样本具有相同的预测分类p;
所述具有相同分类标识c的聚类簇,是指两个干净的聚类簇中超过设定比例的图像样本具有相同的预测分类p。
在一实施例中,所述m个聚类簇中各聚类簇采用超过设定比例的图像样本所具有的预测分类p作为其分类名称。
在一实施例中,获取所述m个聚类簇的中心点特征cluster,包括:
其中,k表示中心点特征cluster的第k个维度,c表示聚类分类的样本集合,i表示一个图像样本。
图6是根据一示例性实施例示出的另一种图像样本分类装置的框图,在图4所示的一种图像样本分类装置的基础上,参见图6,所述目标集合获取单元402包括:
标识对比模块601,被配置为执行对比所述初始分类集合和所述对照分类集合中各聚类中心的标识;
聚类簇合并模块602,被配置为执行在标识相同时,合并具有相同标识的聚类簇;
距离值计算模块603,被配置为执行在标识不同时,计算所述初始分类集合和所述对照分类集合中具有不同标识的聚类中心之间的距离值;
标识替代模块604,被配置为执行利用所述对照分类集合中聚类中心的标识替代所述初始分类集合中聚类中心的标识;参与替代的两个聚类中心的距离值在所述初始分类集合和所述对照分类集合中聚类中心之间的距离值中最小。
在一实施例中,所述距离值包括以下至少一种:欧氏距离和余弦距离。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
至此,本实施例中获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识。本实施例中利用历史聚类的对照分类集合对初始分类集合进行调整,可以使目标分类集合与对照分类集合中各聚类簇形成映射关系,从而使相同图像样本在本次聚类和历史聚类中具有相同的分类标识,避免出现分类漂移现象,有利于提升使用体验。
图7是根据一示例性实施例示出的一种电子设备的框图。例如,电子设备700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,电子设备700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制电子设备700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为电子设备700生成、管理和分配电力相关联的组件。
多媒体组件708包括在电子设备700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当电子设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当电子设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为电子设备700提供各个方面的状态评估。例如,传感器组件714可以检测到电子设备700的打开/关闭状态,组件的相对定位,例如所述组件为电子设备700的显示器和小键盘,传感器组件714还可以检测电子设备700或电子设备700一个组件的位置改变,用户与电子设备700接触的存在或不存在,电子设备700方位或加速/减速和电子设备700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在本公开一实施例中,电子设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在本公开一实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由电子设备700的处理器720执行以完成上述获取观看时长的方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在本公开一实施例中,还提供了一种应用程序,当该应用程序由电子设备的处理器执行时,使得所述电子设备能够执行上述方法,以获取相同的技术效果。
在本公开一实施例中,还提供了一种计算机程序产品,当该计算机程序产品由电子设备的处理器执行时,使得所述电子设备能够执行上述方法,以获取相同的技术效果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置/电子设备/存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖上述各实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (14)
1.一种图像样本分类方法,其特征在于,包括:
获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;
基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图像样本对应的目标分类集合;
根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识;
基于所述对照分类集合调整所述初始分类集合中的各聚类簇,包括:
对比所述初始分类集合和所述对照分类集合中各聚类中心的标识;
若标识相同,则合并具有相同标识的聚类簇;若不同,则计算所述初始分类集合和所述对照分类集合中具有不同标识的聚类中心之间的距离值;
利用所述对照分类集合中聚类中心的标识替代所述初始分类集合中聚类中心的标识;参与替代的两个聚类中心的距离值在所述初始分类集合和所述对照分类集合中聚类中心之间的距离值中最小。
2.根据权利要求1所述的图像样本分类方法,其特征在于,获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类图像集合,包括:
利用预先设置的预测分类模型获取所述待分类的图像样本中各图像样本的图像特征f和预测分类p;
将所述待分类的图像样本的图像特征f输入到训练后的聚类模型,由所述聚类模型确定出所述各图像样本的分类标识c;
基于所述分类标识c和所述预测分类p合并满足设定条件的聚类簇,得到m个聚类簇;
获取所述m个聚类簇的中心点特征cluster,得到包括m个聚类簇的所述初始分类集合。
3.根据权利要求2所述的图像样本分类方法,其特征在于,所述设定条件是指任意两个干净的聚类簇且具有相同分类标识c的聚类簇;其中,
所述干净的聚类簇,是指在一个聚类簇中,有超过设定比例的图像样本具有相同的预测分类p;
所述具有相同分类标识c的聚类簇,是指两个干净的聚类簇中超过设定比例的图像样本具有相同的预测分类p。
4.根据权利要求2所述的图像样本分类方法,其特征在于,所述m个聚类簇中各聚类簇采用超过设定比例的图像样本所具有的预测分类p作为其分类名称。
6.根据权利要求1所述的图像样本分类方法,其特征在于,所述距离值包括以下至少一种:欧氏距离和余弦距离。
7.一种图像样本分类装置,其特征在于,包括:
分类集合获取单元,被配置为执行获取本次聚类的待分类的图像样本对应的聚类簇,得到初始分类集合;以及获取本次聚类之前的历史聚类的对照分类集合;
目标集合获取单元,被配置为执行基于所述对照分类集合调整所述初始分类集合中的各聚类簇,得到所述待分类的图样样本对应的目标分类集合;
分类标识确定单元,被配置为执行根据所述目标分类集合和所述各图像样本所在聚类簇,确定所述待分类的图像样本中各图像样本的分类标识;
所述目标集合获取单元包括:
标识对比模块,被配置为执行对比所述初始分类集合和所述对照分类集合中各聚类中心的标识;
聚类簇合并模块,被配置为执行在标识相同时,合并具有相同标识的聚类簇;
距离值计算模块,被配置为执行在标识不同时,计算所述初始分类集合和所述对照分类集合中具有不同标识的聚类中心之间的距离值;
标识替代模块,被配置为执行利用所述对照分类集合中聚类中心的标识替代所述初始分类集合中聚类中心的标识;参与替代的两个聚类中心的距离值在所述初始分类集合和所述对照分类集合中聚类中心之间的距离值中最小。
8.根据权利要求7所述的图像样本分类装置,其特征在于,所述分类集合获取单元包括:
图像特征获取模块,被配置为执行利用预先设置的预测分类模型获取所述待分类的图像样本中各图像样本的图像特征f和预测分类p;
分类标识确定模块,被配置为执行将所述待分类的图像样本的图像特征f输入到训练后的聚类模型,由所述聚类模型确定出所述各图像样本的分类标识c;
聚类簇获取模块,被配置为执行基于所述分类标识c和所述预测分类p合并满足设定条件的聚类簇,得到m个聚类簇;
初始集合获取模块,被配置为执行获取所述m个聚类簇的中心点特征cluster,得到包括m个聚类簇的所述初始分类集合。
9.根据权利要求8所述的图像样本分类装置,其特征在于,
所述设定条件是指任意两个干净的聚类簇且具有相同分类标识c的聚类簇;其中,
所述干净的聚类簇,是指在一个聚类簇中,有超过设定比例的图像样本具有相同的预测分类p;
所述具有相同分类标识c的聚类簇,是指两个干净的聚类簇中超过设定比例的图像样本具有相同的预测分类p。
10.根据权利要求8所述的图像样本分类装置,其特征在于,所述m个聚类簇中各聚类簇采用超过设定比例的图像样本所具有的预测分类p作为其分类名称。
12.根据权利要求7所述的图像样本分类装置,其特征在于,所述距离值包括以下至少一种:欧氏距离和余弦距离。
13.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述存储器中的可执行指令,以实现如权利要求1~6中任一项所述方法的步骤。
14.一种存储介质,其特征在于,当所述存储介质中的指令由处理器执行时能够执行如权利要求1~6中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911119302.XA CN110929771B (zh) | 2019-11-15 | 2019-11-15 | 图像样本分类方法及装置、电子设备、可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911119302.XA CN110929771B (zh) | 2019-11-15 | 2019-11-15 | 图像样本分类方法及装置、电子设备、可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110929771A CN110929771A (zh) | 2020-03-27 |
CN110929771B true CN110929771B (zh) | 2020-11-20 |
Family
ID=69853973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911119302.XA Active CN110929771B (zh) | 2019-11-15 | 2019-11-15 | 图像样本分类方法及装置、电子设备、可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110929771B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112530409B (zh) * | 2020-12-01 | 2024-01-23 | 平安科技(深圳)有限公司 | 基于几何学的语音样本筛选方法、装置及计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073707A (zh) * | 2010-12-22 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于实时识别短文本类别信息的方法、装置及计算机设备 |
CN102879765A (zh) * | 2012-09-27 | 2013-01-16 | 哈尔滨工程大学 | 基于聚类统计分析的快速信号分选方法 |
CN109389162A (zh) * | 2018-09-28 | 2019-02-26 | 北京达佳互联信息技术有限公司 | 样本图像筛选方法和装置、电子设备及存储介质 |
CN110191085A (zh) * | 2019-04-09 | 2019-08-30 | 中国科学院计算机网络信息中心 | 基于多分类的入侵检测方法、装置及存储介质 |
CN110377695A (zh) * | 2019-06-17 | 2019-10-25 | 广州艾媒数聚信息咨询股份有限公司 | 一种舆情主题数据聚类方法、装置及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10593035B2 (en) * | 2015-03-18 | 2020-03-17 | University Of South Florida | Image-based automated measurement model to predict pelvic organ prolapse |
CN105631483B (zh) * | 2016-03-08 | 2019-03-12 | 国家电网公司 | 一种短期用电负荷预测方法及装置 |
CN107622104B (zh) * | 2017-09-11 | 2020-03-06 | 中央民族大学 | 一种文字图像识别标注方法及系统 |
CN108416013B (zh) * | 2018-03-02 | 2020-12-18 | 北京奇艺世纪科技有限公司 | 视频匹配、检索、分类和推荐方法、装置及电子设备 |
-
2019
- 2019-11-15 CN CN201911119302.XA patent/CN110929771B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102073707A (zh) * | 2010-12-22 | 2011-05-25 | 百度在线网络技术(北京)有限公司 | 用于实时识别短文本类别信息的方法、装置及计算机设备 |
CN102879765A (zh) * | 2012-09-27 | 2013-01-16 | 哈尔滨工程大学 | 基于聚类统计分析的快速信号分选方法 |
CN109389162A (zh) * | 2018-09-28 | 2019-02-26 | 北京达佳互联信息技术有限公司 | 样本图像筛选方法和装置、电子设备及存储介质 |
CN110191085A (zh) * | 2019-04-09 | 2019-08-30 | 中国科学院计算机网络信息中心 | 基于多分类的入侵检测方法、装置及存储介质 |
CN110377695A (zh) * | 2019-06-17 | 2019-10-25 | 广州艾媒数聚信息咨询股份有限公司 | 一种舆情主题数据聚类方法、装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110929771A (zh) | 2020-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109800325B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN109684510B (zh) | 视频排序方法、装置、电子设备及存储介质 | |
RU2649294C2 (ru) | Способ и устройство для построения шаблона и способ и устройство для идентификации информации | |
CN110602527B (zh) | 视频处理方法、装置及存储介质 | |
CN111539443B (zh) | 一种图像识别模型训练方法及装置、存储介质 | |
US20210218696A1 (en) | Method and device for commenting on multimedia resource | |
CN109543066B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN109446961B (zh) | 姿势检测方法、装置、设备及存储介质 | |
CN109819288B (zh) | 广告投放视频的确定方法、装置、电子设备及存储介质 | |
CN109670077B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN109961094B (zh) | 样本获取方法、装置、电子设备及可读存储介质 | |
CN109783656B (zh) | 音视频数据的推荐方法、系统及服务器和存储介质 | |
CN109255128B (zh) | 多层级标签的生成方法、装置和存储介质 | |
CN111259967B (zh) | 图像分类及神经网络训练方法、装置、设备及存储介质 | |
CN110764627B (zh) | 一种输入方法、装置和电子设备 | |
CN110781323A (zh) | 多媒体资源的标签确定方法、装置、电子设备及存储介质 | |
CN109543069B (zh) | 视频推荐方法、装置和计算机可读存储介质 | |
CN111046927B (zh) | 标注数据的处理方法、装置、电子设备及存储介质 | |
CN113609380B (zh) | 标签体系更新方法、搜索方法、装置以及电子设备 | |
CN110941727A (zh) | 一种资源推荐方法、装置、电子设备及存储介质 | |
CN110929771B (zh) | 图像样本分类方法及装置、电子设备、可读存储介质 | |
CN111428806B (zh) | 图像标签确定方法、装置、电子设备及存储介质 | |
CN112328809A (zh) | 实体分类方法、装置及计算机可读存储介质 | |
CN111797746A (zh) | 人脸识别方法、装置及计算机可读存储介质 | |
CN112308588A (zh) | 广告的投放方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |