CN108537270A - 基于多标签学习的图像标注方法、终端设备及存储介质 - Google Patents

基于多标签学习的图像标注方法、终端设备及存储介质 Download PDF

Info

Publication number
CN108537270A
CN108537270A CN201810300031.7A CN201810300031A CN108537270A CN 108537270 A CN108537270 A CN 108537270A CN 201810300031 A CN201810300031 A CN 201810300031A CN 108537270 A CN108537270 A CN 108537270A
Authority
CN
China
Prior art keywords
label
tag
training
attribute
generic attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810300031.7A
Other languages
English (en)
Inventor
翁伟
李建敏
尹华
尹华一
朱顺痣
吴芸
钟瑛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University of Technology
Original Assignee
Xiamen University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University of Technology filed Critical Xiamen University of Technology
Priority to CN201810300031.7A priority Critical patent/CN108537270A/zh
Publication of CN108537270A publication Critical patent/CN108537270A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于多标签学习的图像标注方法、终端设备及存储介质,在该方法中,包括以下步骤:S100:提取实例的所有标签,通过标签传播算法计算多标签训练集中每个实例对应的每个标签的标签重要性程度;S200:根据标签重要性程度对多标签训练集进行重新采样,得到训练子集;S300:计算训练子集的类属属性,根据类属属性进行分类。本发明针对图像标注领域的多义性和海量图像等问题,通过多标签学习来对图像进行标记,通过利用训练样例隐含的相对标签重要性程度的信息来构建更有效的类属属性,通过该方法,不同的标签能够构建出与之对应的更有效的类属属性,在类属属性上构建该标签的分类模型,能够取得更好的图像分类效果。

Description

基于多标签学习的图像标注方法、终端设备及存储介质
技术领域
本发明涉及机器学习技术领域,尤其涉及一种基于多标签学习的图像标注方法、终端设备及存储介质。
背景技术
随着社会的发展,科技化进一步的提高,每天都有海量的数字图像产生并传播,要在如此大规模的图像数据上提供相关的服务,一个最核心也是最困难的任务是让计算机理解图像的语义,而图像标注则是其中的关键技术。图像标注,又称图像自动标注,是指计算机系统根据图像的视觉内容自动底将图像包含的概念标记与之关联的过程,它是基于内容的图像检索的重要领域之一。现如今虽然图像标注领域的研究已经取得了很多成果,待但随着时代的发展与研究的深入,仍有一些问题亟待解决,多义性和大规模性是其中最重要的两个。在传统的监督学习中,一个示例只与一个标签相关联,代表其唯一所属的类别,然而这种标签的唯一性不能满足图像标记的问题,因为一幅图像通常会包含多个语义内容,因而同时具有多个类别的标记,例如为一幅图像可以包括一个或多个语义的概念,比如包括“人”,“草”,“天空”和“日落”;因此亟需一种能够准确标注图像语义的图像标注方法。
发明内容
针对图像标注领域的多义性和海量图像等问题,本发明提供一种基于多标签学习的图像标注方法、终端设备及存储介质,利用训练样例隐含的相对标签重要性程度的信息来构建更有效的类属属性,进而在类属属性上构建该标签的分类模型。
具体方案如下:
一种基于多标签学习的图像标注方法,包括以下步骤:
S100:提取实例的所有标签,通过标签传播算法计算多标签训练集中每个实例对应的每个标签的标签重要性程度;
S200:根据标签重要性程度对多标签训练集进行重新采样,得到训练子集;
S300:计算训练子集的类属属性,根据类属属性进行分类。
进一步的,步骤S100具体包括:
S101:参数设定:
设Y={y1,y2,...,yL}为标签的集合,x=Rd为实例的域;
设D={(xi,Yi)|1≤i≤N}为多标签训练集,包含N个实例,其中xi∈x是一个d维属性向量,是实例xi具备的标签集合;
为多标签训练集D中的实例(xi,Yi)中的xi对应的标签yl的标签重要性程度,其中yl∈Y,设y0为标签重要性程度阈值所对应的虚拟标签,t(xi)为标签重要性程度阈值,则如果则yl是xi相关标签,即yl∈Yi,否则,yl不是xi的相关标签,即
所述标签重要性程度满足以下条件:
条件一:
条件二:
条件三:
S102:设表示实例之间的关联矩阵,其中元素wij的计算公式如下:
其中,σ是相似度计算的参数,固定设置为1;
S103:设M是所述关联矩阵的对角矩阵,M矩阵中对角线上的元素M(i,i)等于W矩阵第i行的和,其余元素为0;
构造矩阵S=M-1/2WM-1/2
构造矩阵Φ=[φ]N×(L+1),其中:
其中τ∈(0,1)为虚拟标签y0对应的比例参数;
S104:构造矩阵F=[fil]N×(L+1)
F(t)=αSF(t-1)+(1-α)Φ
其中,参数α∈(0,1)为比例参数;
S105:设F(0)=Φ,通过变换和运算,得到递归序列{F(t)}收敛于F*
F*=(1-α)(I-αS)-1Φ
S106:基于F*,定义训练集D的每个示例的标签重要性程度如下:
进一步的,步骤S200具体包括:
S201:设定l=1,i=1;
S202:判定是否满足l≤L,如果满足,进入S203,否则,结束;
S203:Dl=D;
S204:判定是否满足i≤N,如果满足,进入S205,否则,进入S215;
S205:设定为空集(NULL);
S206:判断是否满足yl∈Y,如果满足,进入S207,否则,进入S208;
S207:计算
S208:对中的元素进行降序排序;
S209:判断中排在第一个的元素是否为如果是,进入S210,否则,进入S214;
S210:设定Pl为实例Dl中的正实例集,Nl为实例Dl中的负实例集,判断是否同时满足|Pl|≤|Nl|且xi>0,如果满足,进入S211,否则进入S212;
S211:Dl=Dl∪xi
S212:判断是否同时满足|Pl|>|Nl|且xi<0,如果满足,进入S213,否则,进入S214;
S213:Dl=Dl∪xi
S214:设定i=i+1,返回S204;
S215:设定l=l+1,返回S202。
进一步的,步骤S300中所述类属属性的计算方法为通过属性变换方法来计算,所述属性变换方法为基于训练子集Dl分别在正实例集和负实例集两种情况下执行k-means算法,然后通过检测训练数据子集Dl的实例与聚类中心之间的距离,来构造类属属性。
进一步的,步骤S300具体包括:
S301:分别对正实例集Pl和负实例集Nl进行k-means均值聚类,设置聚类个数c的计算公式为:
其中,r∈(0,1)是一个控制聚类的数目的比例参数;
S302:设定类属属性为实例与聚类中心之间的距离,其中d(·,·)表示两个实例之间的欧氏距离;设定聚类中心为通过则每个xi的属性映射函数计算yl的类属属性,所述属性映射函数的计算公式为:
S303:将训练数据子集Dl中的所有实例进行映射,得到映射后的实例Bl的集合:
Bl={(φl(xi),Yi(l))|(xi,Yi)∈Dl}
其中,当yl∈Yi时,Yi(l)=+1,否则,Yi(l)=-1;
S304:根据实例Bl建立标签yl的二分类模型fl
一种基于多标签学习的图像标注终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例上述的方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述的方法的步骤。
本发明采用如上技术方案,针对图像标注领域的多义性和海量图像等问题,通过多标签学习来对图像进行标记,通过利用训练样例隐含的相对标签重要性程度的信息来构建更有效的类属属性,通过该方法,不同的标签能够构建出与之对应的更有效的类属属性,在类属属性上构建该标签的分类模型,能够取得更好的图像分类效果。
附图说明
图1所示为本发明实施例一的流程示意图。
图2所示为本发明实施例一的步骤S200的流程示意图。
具体实施方式
为进一步说明各实施例,本发明提供有附图。这些附图为本发明揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本发明的优点。图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
现结合附图和具体实施方式对本发明进一步说明。
实施例一:
本发明实施例一提供了一种基于多标签学习的图像标注方法,多标签学习的目的是定义一个分类模型fl:x→R(l=1,2,...,L)。fl值越大意味着实例越可能具备yl标签。排序函数rank(·,·)可以从函数f(·)中转化得到:对于任意的yk∈Y,yj∈Y(k≠j),若fk(xi)>fj(xi),那么rank(xi,yk)<rank(xi,yj)。如果给定一个阈值σ,我们可以基于f(·)定义分类器h:x→2y,对于一个实例xi∈x,若fk(xi)>σ,那么yj∈h(xi),否则
如图1所示,其为本发明实施例一所述的基于多标签学习的图像标注方法的流程示意图,所述方法可包括以下步骤:
S100:提取实例的所有标签,通过标签传播算法计算多标签训练集中每个实例对应的每个标签的标签重要性程度,该实施例中,所述实例为图像,所述实例的标签为“水”、“天空”、“船”、“山峰”、“行人”和“树”等代表图像内容的标签。
步骤S100具体包括:
S101:参数设定:
设Y={y1,y2,...,yL}为标签的集合,x=Rd为实例的域。
设D={(xi,Yi)|1≤i≤N}为多标签训练集,包含N个实例,其中xi∈x是一个d维属性向量,是实例xi具备的标签集合。
在为每个标签构造类属属性的过程中,每个训练样例的标签重要性程度都是不同的。换句话说,假定对任意标签来说,所有的训练样例都同等重要,都适合构造类属属性,但这并不是事实。例如,在一个风景图像数据库中,标签全集设为{“水”、“天空”、“船”、“山峰”、“行人”、“树”},不失一般性,拿“山峰”这个标签来说,有些图像主要景色就是“山峰”,而另一些图像“山峰”只是出现在水中模模糊糊难以分辨的倒影,甚至还有些图像根本没有“山峰”。可见,这些图像,对“山峰”这个标签来说,重要性不尽相同。同时,也可以看出,标签重要性程度是相对的概念,需要多个标签一起考察,才能得到。
因此,该实施例中,通过标签重要性程度来构造类属属性,具体的为:
设定为多标签训练集D中的实例(xi,Yi)中的xi对应的标签yl的标签重要性程度,即的值表示度量xi时yl所传达的语义的程度,的值越大,语义传递的越多,其中yl∈Y。
为了表示标签yl是否与实例相关,我们为每个实例xi设置相应的阈值t(xi),具体来说,如果yl是xi相关实例(即yl∈Yi),否则,yl不是xi的相关实例,即我们设定了一个对应于标签重要性程度阈值的虚拟标签y0,随后,原标签空间增大到因此,y0是有关和无关的标签之间的分割点。
该标签重要性程度满足以下条件:
条件一:非负:
条件二:归一化:
条件三:二分类阈值:对xi的相关标签的设置可以确定:
根据条件一和条件二,该标签重要性程度是一个可以被看作为在标签空间中的一个标签分布,它是实体依赖的。正如条件三所述,标签重要性程度阈值t(xi)可以被定义为如果则yl是xi相关实例(即yl∈Yi),否则,yl不是xi的相关实例(即)。所以,标签重要性程度也可以被看作是判断一个对应的标签是否是相关的实例的指标。需要被注意的是,当传统标签空间是符合逻辑的时候,每个标签的标签重要性程度值是真实的。因此,与原来的标签相比,标签重要性程度会带来如下优势:
(1).它有助于区分哪些标签对于描述实例更为重要;
(2).它承载了更多的语义信息,可以更全面地描述实例;
(3).它有助于做出更复杂的决定。
S102:为了计算所有训练样例的标签重要性程度,我们选择了广泛使用的迭代标签传播技术方法,设表示实例之间的关联矩阵,其中元素wij的计算公式如下:
其中,σ是相似度计算的参数,该实施例中固定设置为1,可根据实际应用修改。
S103:设M是所述关联矩阵的对角矩阵,M矩阵中对角线上的元素M(i,i)等于W矩阵第i行的和,其余元素为0。
相应的,我们构造矩阵S=M-1/2WM-1/2 (2)
为了记录最初的标签,构造矩阵Φ=[φ]N×(L+1),其中:
其中τ∈(0,1)为虚拟标签y0对应的比例参数。
S104:在fil>0所对应的标签重要性程度处,定义了一个拥有非负项的矩阵F=[fil]N×(L+1),F随着矩阵S和Φ所传递的标签重要性改变:
F(t)=αSF(t-1)+(1-α)Φ (4)
其中,参数α∈(0,1)为比例参数。
S105:设F(0)=Φ,通过变换和运算,可以知道递归序列{F(t)}将会收敛于F*
F*=(1-α)(I-αS)-1Φ (5)
S106:基于F*,每个训练样例的标签重要性程度被估计为:
由于基于类属属性可以获得一个有效的分类系统,我们充分利用每个标签的类聚结果去构造类属属性,该实施例的基于多标签学习的图像标注方法中利用适当的训练子集,而不是原始的训练数据,来构造类属属性。具体地说,每个标签的类属属性的构造过程可以分为两个步骤进行:训练子集选择和属性变换。在第一步中,我们根据标签重要性程度信息,选择合适的训练子集;第二步,我们利用一个属性变换方法得到类属属性。具体来说,就是基于子集分别在正实例、负实例两种情况下执行k-means算法,然后通过检测训练子集实例与聚类中心之间的距离,来构造类属属性。接下来将具体这两个步骤。
S200:根据标签重要性程度对多标签训练集进行重新采样,得到训练子集。
对于一个给定的标签yl∈Y,一个实例xi被视为标签重要性阈值。若那么xi为yl的正实例,否则,xi为yl的负实例。第一种情况,如果大于1/2,则表示xi是一个“强”正实例,即它是yl的强判别信息。第二种情况,如果小于1/2,则表示xi是一个“强”负实例,那么,它也是yl的强判别信息,因此,我们复制这些“强”实例来提高标签的辨别能力。如果对于标签yl来说,它的正实例数量少于它的负实例,那么我们复制它的那些“强”正实例,否则我们复制它的“强”负实例。我们假设函数abs(.)返回绝对值为的值越大时,xi传递的判别信息越多。设并且对中的元素进行降序排序,那么xi对于那些排在序列前的元素所对应的标签来说是“强”实例。我们设置一个变量l用来表示那些需要被复制的xi所对应的标签数量,并且在我们的算法中设置l=1。同时,由于多标签学习通常都存在高水平的类不平衡现象,我们尝试通过重新采样去缓解这样的现象发生。如果yl中的排序是第一的,那么我们为它复制xi时需要遵循以下要求:xi是个正实例,并且正实例的数量应少于负实例的数量,或xi是个负实例,并且正实例的数量应多于负实例的数量。我们将原来的训练集和这些重复的实例作为新的训练集,为方便起见,将新的训练集称为Dl
如图2所示,具体步骤如下:
S201:设定l=1,i=1;
S202:判定是否满足l≤L,如果满足,进入S203,否则,结束;
S203:Dl=D;
S204:判定是否满足i≤N,如果满足,进入S205,否则,进入S215;
S205:设定为空集(NULL);
S206:判断是否满足yl∈Y,如果满足,进入S207,否则,进入S208;
S207:计算
S208:对中的元素进行降序排序;
S209:判断中排在第一个的元素是否为如果是,进入S210,否则,进入S214;
S210:设定Pl为实例Dl中的正实例集,Nl为实例Dl中的负实例集,判断是否同时满足|Pl|≤|Nl|且xi>0,如果满足,进入S211,否则进入S212;
S211:Dl=Dl∪xi
S212:判断是否同时满足|Pl|>|Nl|且xi<0,如果满足,进入S213,否则,进入S214;
S213:Dl=Dl∪xi
S214:设定i=i+1,返回S204;
S215:设定l=l+1,返回S202。
S300:通过属性转换来计算训练子集的类属属性,根据类属属性进行分类。
所述类属属性的计算方法为通过属性变换方法来计算,所述属性变换方法为基于训练子集Dl分别在正实例集Pl和负实例集Nl两种情况下执行k-means算法,然后通过检测训练数据子集Dl的实例与聚类中心之间的距离,来构造类属属性。
S301:为yl标签得到合适的实例Dl之后,设定Pl为实例Dl中的正实例集,Nl为实例Dl中的负实例集,对这些实例集采用k-means算法,我们设置聚类个数c的计算公式为:
其中,r∈(0,1)是一个控制聚类的数目的比例参数。
S302:设定类属属性为实例与聚类中心之间的距离,其中d(·,·)表示两个实例之间的欧氏距离。
设定聚类中心是我们可以得到每个xi的属性映射函数
S303:将训练数据子集Dl中的所有实例进行映射,得到映射后的实例Bl的集合:
Bl={(φl(xi),Yi(l))|(xi,Yi)∈Dl} (9)
其中,当yk∈Yi时,Yi(l)=+1,否则Yi(l)=-1。
S304:根据实例Bl建立标签yl的二分类模型fl,在实际应用中,根据需要选择分类算法,该实施例中根据实例Bl来为标签yl诱导一个二分类模型gl:Bl→R,对于给出的不可见的样例u∈x,它的关联标签集为:
Y={yl|gl(φ(u))|(xi,Yi)∈Dl} (10)
因此,所述分类模型fl可以被看成是由gl组成的,即fl(u)=gll(u))。
下面为该实施例一的完整算法,其中步骤1-3为标签重要性程度的计算过程,步骤5-21为重新采样得到训练子集的过程,步骤22-25为计算训练子集的类属属性,根据类属属性建立相应的二元分类模型。
具体算法如下:
1.输入:
D:多标签训练数据;
τ:公式(3)的初始阈值的重要参数;
α:公式(4)中的平衡参数;
γ:公式(7)的比值参数;
ζ:用于分类归纳的二进制学习器;
2.输出:
gl(1≤l≤L):yl标签的分类模型;
本发明实施例一针对图像标注领域的多义性和海量图像等问题,通过多标签学习来对图像进行标记,通过利用训练样例隐含的相对标签重要性程度的信息来构建更有效的类属属性,通过该方法,不同的标签能够构建出与之对应的更有效的类属属性,在类属属性上构建该标签的分类模型,能够取得更好的图像分类效果。
实施例二:
本发明还提供一种基于多标签学习的图像标注终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例一的上述方法实施例中的步骤。
进一步地,作为一个可执行方案,所述基于多标签学习的图像标注终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述基于多标签学习的图像标注终端设备可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,上述基于多标签学习的图像标注终端设备的组成结构仅仅是基于多标签学习的图像标注终端设备的示例,并不构成对基于多标签学习的图像标注终端设备的限定,可以包括比上述更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述基于多标签学习的图像标注终端设备还可以包括输入输出设备、网络接入设备、总线等,本发明实施例对此不做限定。
进一步地,作为一个可执行方案,所称处理器可以是中央处理单元(CentranProcessing Unit,CHECKPOINTU),还可以是其他通用处理器、数字信号处理器(DigitanSignan Processor,DSP)、专用集成电路(Appnication Specific Integrated Circuit,ASIC)、现成可编程门阵列(Fiend-Programmabne Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述基于多标签学习的图像标注终端设备的控制中心,利用各种接口和线路连接整个基于多标签学习的图像标注终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述基于多标签学习的图像标注终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据手机的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digitan,SD)卡,闪存卡(Fnash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例上述方法的步骤。
所述基于多标签学习的图像标注终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Onny Memory)及随机存取存储器(RAM,Random Access Memory)。
尽管结合优选实施方案具体展示和介绍了本发明,但所属领域的技术人员应该明白,在不脱离所附权利要求书所限定的本发明的精神和范围内,在形式上和细节上可以对本发明做出各种变化,均为本发明的保护范围。

Claims (7)

1.一种基于多标签学习的图像标注方法,其特征在于:包括以下步骤:
S100:提取实例的所有标签,通过标签传播算法计算多标签训练集中每个实例对应的每个标签的标签重要性程度;
S200:根据标签重要性程度对多标签训练集进行重新采样,得到训练子集;
S300:计算训练子集的类属属性,根据类属属性进行分类。
2.根据权利要求1所述的基于多标签学习的图像标注方法,其特征在于:步骤S100具体包括:
S101:参数设定:
设Y={y1,y2,...,yL}为标签的集合,x=Rd为实例的域;
设D={(xi,Yi)|1≤i≤N}为多标签训练集,包含N个实例,其中xi∈x是一个d维属性向量,是实例xi具备的标签集合;
为多标签训练集D中的实例(xi,Yi)中的xi对应的标签yl的标签重要性程度,其中yl∈Y,设y0为标签重要性程度阈值所对应的虚拟标签,t(xi)为标签重要性程度阈值,则如果则yl是xi相关标签,即yl∈Yi,否则,yl不是xi的相关标签,即
所述标签重要性程度满足以下条件:
条件一:
条件二:
条件三:
S102:设W=[wij]N×N表示实例之间的关联矩阵,其中元素wij的计算公式如下:
其中,σ是相似度计算的参数,固定设置为1;
S103:设M是所述关联矩阵的对角矩阵,M矩阵中对角线上的元素M(i,i)等于W矩阵第i行的和,其余元素为0;
构造矩阵S=M-1/2WM-1/2
构造矩阵Φ=[φ]N×(L+1),其中:
其中τ∈(0,1)为虚拟标签y0对应的比例参数;
S104:构造矩阵F=[fil]N×(L+1)
F(t)=αSF(t-1)+(1-α)Φ
其中,参数α∈(0,1)为比例参数;
S105:设F(0)=Φ,通过变换和运算,得到递归序列{F(t)}收敛于F*
F*=(1-α)(I-αS)-1Φ
S106:基于F*,定义训练集D的每个示例的标签重要性程度如下:
3.根据权利要求1所述的基于多标签学习的图像标注方法,其特征在于:步骤S200具体包括:
S201:设定l=1,i=1;
S202:判定是否满足l≤L,如果满足,进入S203,否则,结束;
S203:Dl=D;
S204:判定是否满足i≤N,如果满足,进入S205,否则,进入S215;
S205:设定为空集(NULL);
S206:判断是否满足yl∈Y,如果满足,进入S207,否则,进入S208;
S207:计算
S208:对中的元素进行降序排序;
S209:判断中排在第一个的元素是否为如果是,进入S210,否则,进入S214;
S210:设定Pl为实例Dl中的正实例集,Nl为实例Dl中的负实例集,判断是否同时满足|Pl|≤|Nl|且xi>0,如果满足,进入S211,否则进入S212;
S211:Dl=Dl∪xi
S212:判断是否同时满足|Pl|>|Nl|且xi<0,如果满足,进入S213,否则,进入S214;
S213:Dl=Dl∪xi
S214:设定i=i+1,返回S204;
S215:设定l=l+1,返回S202。
4.根据权利要求3所述的基于多标签学习的图像标注方法,其特征在于:步骤S300中所述类属属性的计算方法为通过属性变换方法来计算,所述属性变换方法为基于训练子集Dl分别在正实例集和负实例集两种情况下执行k-means算法,然后通过检测训练数据子集Dl的实例与聚类中心之间的距离,来构造类属属性。
5.根据权利要求4所述的基于多标签学习的图像标注方法,其特征在于:步骤S300具体包括:
S301:分别对正实例集Pl和负实例集Nl进行k-means均值聚类,设置聚类个数c的计算公式为:
c=[r×min(|Pl|,|Nl|)]
其中,r∈(0,1)是一个控制聚类的数目的比例参数;
S302:设定类属属性为实例与聚类中心之间的距离,其中d(·,·)表示两个实例之间的欧氏距离;设定聚类中心为通过则每个xi的属性映射函数计算yl的类属属性,所述属性映射函数的计算公式为:
S303:将训练数据子集Dl中的所有实例进行映射,得到映射后的实例Bl的集合:
Bl={(φl(xi),Yi(l))|(xi,Yi)∈Dl}
其中,当yl∈Yi时,Yi(l)=+1,否则,Yi(l)=-1;
S304:根据实例Bl建立标签yl的二分类模型fl
6.一种基于多标签学习的图像标注终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1~5所述方法的步骤。
7.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1~5所述方法的步骤。
CN201810300031.7A 2018-04-04 2018-04-04 基于多标签学习的图像标注方法、终端设备及存储介质 Withdrawn CN108537270A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810300031.7A CN108537270A (zh) 2018-04-04 2018-04-04 基于多标签学习的图像标注方法、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810300031.7A CN108537270A (zh) 2018-04-04 2018-04-04 基于多标签学习的图像标注方法、终端设备及存储介质

Publications (1)

Publication Number Publication Date
CN108537270A true CN108537270A (zh) 2018-09-14

Family

ID=63481849

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810300031.7A Withdrawn CN108537270A (zh) 2018-04-04 2018-04-04 基于多标签学习的图像标注方法、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN108537270A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162649A (zh) * 2019-05-24 2019-08-23 北京百度网讯科技有限公司 样本数据获取方法、获取系统、服务器和计算机可读介质
CN111898467A (zh) * 2020-07-08 2020-11-06 浙江大华技术股份有限公司 属性识别方法及装置、存储介质、电子装置
CN114048320A (zh) * 2022-01-12 2022-02-15 成都信息工程大学 一种基于课程学习的多标签国际疾病分类训练方法
CN114117040A (zh) * 2021-11-08 2022-03-01 重庆邮电大学 基于标签特定特征和相关性的文本数据多标签分类方法
CN117218396A (zh) * 2023-10-08 2023-12-12 深圳海角兰科技有限公司 基于大模型的视觉样本数据自动标注方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971201A (zh) * 2017-03-23 2017-07-21 重庆邮电大学 基于集成学习的多标签分类方法
CN107316063A (zh) * 2017-06-26 2017-11-03 厦门理工学院 多标记分类方法、装置、介质及计算设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106971201A (zh) * 2017-03-23 2017-07-21 重庆邮电大学 基于集成学习的多标签分类方法
CN107316063A (zh) * 2017-06-26 2017-11-03 厦门理工学院 多标记分类方法、装置、介质及计算设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
MIN-LING ZHANG 等: "Lift: Multi-Label Learning with Label-Specific Features", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》 *
YU-KUN LI 等: "Leveraging implicit relative labeling-importance information for effective multi-label learning", 《2015 IEEE INTERNATIONAL CONFERENCE ON DATA MINING》 *
吴磊 等: "基于类属属性的多标记学习算法", 《软件学报》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110162649A (zh) * 2019-05-24 2019-08-23 北京百度网讯科技有限公司 样本数据获取方法、获取系统、服务器和计算机可读介质
CN110162649B (zh) * 2019-05-24 2021-06-18 北京百度网讯科技有限公司 样本数据获取方法、获取系统、服务器和计算机可读介质
CN111898467A (zh) * 2020-07-08 2020-11-06 浙江大华技术股份有限公司 属性识别方法及装置、存储介质、电子装置
CN111898467B (zh) * 2020-07-08 2023-02-28 浙江大华技术股份有限公司 属性识别方法及装置、存储介质、电子装置
CN114117040A (zh) * 2021-11-08 2022-03-01 重庆邮电大学 基于标签特定特征和相关性的文本数据多标签分类方法
CN114048320A (zh) * 2022-01-12 2022-02-15 成都信息工程大学 一种基于课程学习的多标签国际疾病分类训练方法
CN114048320B (zh) * 2022-01-12 2022-03-29 成都信息工程大学 一种基于课程学习的多标签国际疾病分类训练方法
CN117218396A (zh) * 2023-10-08 2023-12-12 深圳海角兰科技有限公司 基于大模型的视觉样本数据自动标注方法及系统

Similar Documents

Publication Publication Date Title
Yu et al. Hierarchical deep click feature prediction for fine-grained image recognition
CN108537270A (zh) 基于多标签学习的图像标注方法、终端设备及存储介质
EP3757905A1 (en) Deep neural network training method and apparatus
CN105354307B (zh) 一种图像内容识别方法及装置
CN105446988B (zh) 预测类别的方法和装置
CN111667022A (zh) 用户数据处理方法、装置、计算机设备和存储介质
WO2021164317A1 (zh) 序列挖掘模型的训练方法、序列数据的处理方法及设备
CN111738341B (zh) 一种分布式大规模人脸聚类方法及装置
CN112069319A (zh) 文本抽取方法、装置、计算机设备和可读存储介质
CN108629358B (zh) 对象类别的预测方法及装置
CN109492093A (zh) 基于高斯混合模型和em算法的文本分类方法及电子装置
CN110008365B (zh) 一种图像处理方法、装置、设备及可读存储介质
CN112668482B (zh) 人脸识别训练方法、装置、计算机设备及存储介质
CN108228684A (zh) 聚类模型的训练方法、装置、电子设备和计算机存储介质
CN113051914A (zh) 一种基于多特征动态画像的企业隐藏标签抽取方法及装置
CN113515669A (zh) 基于人工智能的数据处理方法和相关设备
CN113742488A (zh) 基于多任务学习的嵌入式知识图谱补全方法和装置
WO2023024408A1 (zh) 用户特征向量确定方法、相关设备及介质
CN111538859A (zh) 一种动态更新视频标签的方法、装置及电子设备
CN112598089B (zh) 图像样本的筛选方法、装置、设备及介质
CN112668633B (zh) 一种基于细粒度领域自适应的图迁移学习方法
CN115168609A (zh) 一种文本匹配方法、装置、计算机设备和存储介质
CN113610106B (zh) 模型间的特征兼容学习方法、装置、电子设备及介质
CN111091198B (zh) 一种数据处理方法及装置
CN113779287A (zh) 基于多阶段分类器网络的跨域多视角目标检索方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180914