CN106384125A - 面向偏标记数据的数字图像分类方法 - Google Patents
面向偏标记数据的数字图像分类方法 Download PDFInfo
- Publication number
- CN106384125A CN106384125A CN201610803784.0A CN201610803784A CN106384125A CN 106384125 A CN106384125 A CN 106384125A CN 201610803784 A CN201610803784 A CN 201610803784A CN 106384125 A CN106384125 A CN 106384125A
- Authority
- CN
- China
- Prior art keywords
- classification
- image
- mark
- authentic signature
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开一种用于数字图像的面向偏标记数据的数字图像分类方法,包括初始化正则化因子与参数矩阵;在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;更新正则化因子并初始化当前目标函数值;根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;根据分类模型设置参数矩阵;根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;根据分类模型和真实标记指派,计算新目标函数值等步骤。该方法通过定义自己独有的目标函数,在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时,可有效地对数字图像进行分类。
Description
技术领域
本发明涉及一种数字图像分类方法,特别涉及一种适用于已有图像对应着一个候选标记集合,并且该集合中仅有一个标记为该图像真实标记的情况。
背景技术
随着互联网的快速发展,数字图像的获得变得越来越容易、在各行业中出现的数字图像的规模也在迅速增长。因此如何对数字图像进行自动化处理变得越来越重要。图像分类技术是一种辅助用户高效地获取期望图像的方法,同时也是很多与图像相关的人机交互系统取得成功的基础,如检索系统、推荐系统等。该方法通过用户提交给分类装置的查询图像,快速、准确地将图像库中的未分类图像进行分类,以方便用户获取期望的图像。一种有效的图像分类策略是将分类过程看作一个学习过程,利用用户提交的查询图像作为学习所需的样本,使用机器学习技术学习得到一个分类模型,从而实现对数字图像的分类。
在现实问题中,获得一张图像是较为容易的事情。然而由于问题的特性或成本等原因,对图像进行标记可能是一件较为困难的事情。在真实世界中,已知的图像可能是以偏标记样本的形式给出的:一副图像对应着多个可能的标记组成的候选标记集合,然而这些标记中有且仅有一个标记为该图像的真实标记。比如,在一些新闻网站中,一张新闻图片包含着若干人物的人脸,图片的标题中含有这些人物的姓名。此时,我们通常不能确切地获取人脸和姓名的对应关系,而只能获取一张人脸对应的几个可能的姓名。已有的数字图像分类技术不能有效地处理图像对应一个候选标记集合且真实标记未知的情况,故不能有效地在该场景下进行图像分类。
发明内容
本发明的主要目的是针对目前的数字图像分类技术需要大量已分类图像且只能将图像分为一个类别的问题,提出一种能够处理图像对应一个候选标记集合且真实标记未知时的分类方法。
为利用偏标记数字图像且对数字图像的所有可能类别进行分类,本发明引入了机器学习领域中的最大间隔准则,进而提出一种基于偏标记数据的数字图像分类方法:该方法包括以下步骤:
(1)用户从已有的偏标记图像库中选择样例图像;(2)初始化正则化因子与参数矩阵;(3)在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;(4)更新正则化因子并初始化当前目标函数值;(5)若正则化因子大于一个阈值,执行步骤(11);(6)根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;(7)根据分类模型设置参数矩阵;(8)根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;(9)根据分类模型和真实标记指派,计算新目标函数值;(10)若新目标函数值与当前目标函数值差异小于一个阈值,执行步骤(4);否则,将新目标函数值设为当前目标函数值,执行步骤(6);(11)结束。
本发明有益效果:
本发明给出了一种用于数字图像是偏标记样本形式时的分类方法,该方法通过定义自己独有的目标函数,在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时,可有效地对数字图像进行分类。
下面将结合附图对最佳实施例进行详细说明。
附图说明
图1是数字图像分类装置的工作流程图
图2是本发明方法的流程图
图3是本发明学习分类模型的流程图
具体实施方式
如图1所示,数字图像存储设备中存放了待分类的数字图像,此外还存在一个偏标记图像库,该图像库中的每个数字图像均对应了一组人工标注的概念标记集合,而该集合中有且仅有一个标记为该图像的真实标记。用户从偏标记数字图像库中选择M幅图像提交给数字图像分类装置,选取的样例图像应尽可能涵盖各个类别。每幅图像可使用数字图像处理教科书中的多种经典方法生成适当的图像特征,由此,每幅图像可由一个特征向量进行表示。在得到图像特征后,使用本发明提出的分类方法可得到一个基于偏标记图像样本的分类模型。基于最终分类模型对数字图像存储设备中的待分类图像进行分类,如图1所示。如果用户对所得结果不满意,可以从偏标记数字图像库中选取更多的查询图像反馈给数字图像分类装置。
本发明涉及的方法如图2所示。值得注意的是,本发明中提出的图像分类方法由q个线性模型Θ={(wp,bp)|1≤p≤q}组成,其中:q为所有可能的图像类别个数,wp与bp为线性模型与第p个类别对应的权值向量和偏置。步骤10是起始动作。假设用户提交的查询图像对应于集合其中:m为查询图像的个数,为图像Xi对应的候选标记集合,图像Xi的真实标记yi未知但满足yi∈Si。本发明的任务是基于图像集合得到一个由输入空间映射至标记空间的多类分类器
步骤11是本发明得到多类分类模型的过程,其详细说明如图3所示。步骤12利用训练得到的最终分类模型,对数字图像存储设备中的待分类图像进行分类。在输出分类结果后,分类装置即进入步骤13所示的结束状态。
具体来说,本发明中提出的分类方法通过优化以下目标函数,从而得到最终分类模型:
其中:C为正则化因子,ξ={ξ1,ξ2,...,ξm}为松弛变量集合,y={y1,y2,...,ym}为真实标记指派,为真实标记指派的可行解空间。此外,np为标记yp的先验样本个数,其取值对应于每个样本在yp上的置信度之和。若yp为样本Xi的候选标记,则置信度为否则为0。当样本Xi的真实标记为yi时,与为相应类别yi的权值向量和偏置,与为其他类别对应的权值向量和偏置,T表示转置;当谓词τ成立时,函数取值为1,否则取值为0。
图3给出了图2中步骤11的详细描述,具体说明了如何利用本发明提出的分类方法在所有的查询图像上优化得到步骤11中的最终分类模型。由于式(1)所示目标函数难以直接进行优化,本发明基于交替优化策略迭代求解真实标记指派y和模型参数Θ(步骤1106-1111)。
当模型中的真实标记指派y给定时,模型转化为一个传统的多类分类问题,通过优化该问题,即可更新分类问题中的模型参数(步骤1007):
当模型参数给定时,通过求解以下线性规划问题即可求解新的真实标记指派(步骤1009):
0≤zpi≤1 (3)
其中,Z=[zpi]q×m为训练集上的二值标记矩阵,zpi=1表示xi的真实标记为标记空间中的第p个类别。C=[cpi]q×m是一个参数矩阵,其中cpi表示将第p个类别作为xi真实标记时所产生的损失:
其中:表示将第p个类别作为示例xi真实标记时的多类间隔:
M是一个由用户预先设定的大数值(如105),wp′与bp′分别表示线性模型与第p’个类别对应的权值向量和偏置。基于此,若选取Xi的非候选标记为示例Xi的真实标记,将产生一个很大的损失。这个策略保证了模型求解出的每个样本的真实标记指派处在其候选标记集合上。
在循环体1106-1111外,1004-1111构成另一循环体。本发明采用逐渐增大正则化因子的方式(步骤1004-1105),避免模型收敛到局部最小值。正则化因子的增长系数为1+Δ,最大取值为Cmax。Xi在循环体1004-1111开始之前,本发明按下式初始化参数矩阵C:
然后求解线性规划问题(3),得到初始的真实标记指派。当整个交替优化过程完成后,装置进入结束状态(步骤1112),最后得到的模型参数可用于未见图像的预测和现有图像的消歧。
本发明给出了一种用于数字图像是偏标记样本形式时的分类方法,该方法通过定义自己独有的目标函数,在数字图像对应着由多个标记组成的候选标记集合并且该集合中有且仅有一个真实标记时,可有效地对数字图像进行分类。
熟知本领域的人士将理解,虽然这里为便于解释已描述了具体实施例,但是可在不背离本发明精神和范围的情况下作出各种改变。因此,除了所附权利要求之外不能用于限制本发明。
Claims (4)
1.一种基于偏标记数据的数字图像分类方法,其特征在于包括如下步骤:
(1)用户从已有的偏标记图像库中选择样例图像;
(2)初始化正则化因子与参数矩阵;
(3)在现有的样例图像上通过求解一个线性规划问题,得到真实标记指派;
(4)更新正则化因子并初始化当前目标函数值;
(5)若正则化因子大于一个阈值,执行步骤(11);
(6)根据真实标记指派和正则化因子,通过求解一个多类支持向量机问题,更新分类模型;
(7)根据分类模型设置参数矩阵;
(8)根据参数矩阵和分类模型,通过求解一个线性规划问题,更新真实标记指派;
(9)根据分类模型和真实标记指派,计算新目标函数值;
(10)若新目标函数值与当前目标函数值差异小于一个阈值,执行步骤(4);否则,将新目标函数值设为当前目标函数值,执行步骤(6);
(11)结束。
2.如权利要求1所述的基于偏标记数据的数字图像分类方法,其特征在于所述分类模型采用如下目标函数表示:
其中:q为所有可能的图像类别个数,m为查询图像的个数,C为正则化因子,ξ={ξ1,ξ2,...,ξm}为松弛变量集合,y={y1,y2,...,ym}为真实标记指派,S=S1×S2×…×Sm为真实标记指派的可行解空间,Si为图像Xi对应的候选标记集合,其取值对应于每个样本在标记yp上的置信度之和,此外,np为标记yp的先验样本个数,其取值对应于每个样本在标记yp上的置信度之和;若yp为样本Xi的候选标记,则置信度为否则为0;Θ={(wp,bp)|1≤p≤q}为线性模型,Wp与bp为线性模型与第p个类别对应的权值向量和偏置;当样本Xi的真实标记为yi时,与为相应类别yi的权值向量和偏置,与为其他类别对应的权值向量和偏置,T表示转置;当谓词τ成立时,函数II(τ)取值为1,否则II(τ)取值为0。
3.如权利要求2所述的基于偏标记数据的数字图像分类方法,其特征在于当线性模型参数给定时,通过求解以下线性规划问题求解新的真实标记指派:
其中:Z=[zpi]q×m为训练集上的二值标记矩阵,Zpi=1表示样本xi的真实标记为标记空间中的第p个类别;C=[cpi]q×m是一个参数矩阵,其中cpi表示将第p个类别作为样本xi真实标记时所产生的损失;
表示将第p个类别作为示例xi真实标记时的多类间隔:
M是一个由用户预先设定的数值,Wp′与bp′分别表示线性模型与第p’个类别对应的权值向量和偏置。
4.如权利要求2所述的基于偏标记数据的数字图像分类方法,其特征在于当模型中的真实标记指派y给定时,模型转化为一个传统的多类分类问题,通过求解该问题更新分类问题中的模型参数:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610803784.0A CN106384125A (zh) | 2016-09-05 | 2016-09-05 | 面向偏标记数据的数字图像分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610803784.0A CN106384125A (zh) | 2016-09-05 | 2016-09-05 | 面向偏标记数据的数字图像分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106384125A true CN106384125A (zh) | 2017-02-08 |
Family
ID=57939493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610803784.0A Pending CN106384125A (zh) | 2016-09-05 | 2016-09-05 | 面向偏标记数据的数字图像分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106384125A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263620A (zh) * | 2019-05-06 | 2019-09-20 | 杭州电子科技大学 | 一种基于l2,1偏标记学习的年龄估计方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069133A (zh) * | 2015-08-18 | 2015-11-18 | 东南大学 | 一种基于未标记数据的数字图像分类方法 |
CN105701509A (zh) * | 2016-01-13 | 2016-06-22 | 清华大学 | 一种基于跨类别迁移主动学习的图像分类方法 |
-
2016
- 2016-09-05 CN CN201610803784.0A patent/CN106384125A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105069133A (zh) * | 2015-08-18 | 2015-11-18 | 东南大学 | 一种基于未标记数据的数字图像分类方法 |
CN105701509A (zh) * | 2016-01-13 | 2016-06-22 | 清华大学 | 一种基于跨类别迁移主动学习的图像分类方法 |
Non-Patent Citations (3)
Title |
---|
FEI YU 等: "Maximum Margin Partial Label Learning", 《JMLR: WORKSHOP AND CONFERENCE PROCEEDINGS》 * |
NAM HGUYEN 等: "Classification with Partial Labels", 《PROCEEDING OF THE 14TH ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 * |
于菲 等: "基于决策树集成的偏标记学习算法", 《模式识别与人工智能》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263620A (zh) * | 2019-05-06 | 2019-09-20 | 杭州电子科技大学 | 一种基于l2,1偏标记学习的年龄估计方法 |
CN110263620B (zh) * | 2019-05-06 | 2021-06-01 | 杭州电子科技大学 | 一种基于l2,1偏标记学习的年龄估计方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558942B (zh) | 一种基于浅度学习的神经网络迁移方法 | |
CN111191732B (zh) | 一种基于全自动学习的目标检测方法 | |
CN110210486B (zh) | 一种基于素描标注信息的生成对抗迁移学习方法 | |
Rymarczyk et al. | Interpretable image classification with differentiable prototypes assignment | |
CN107909101B (zh) | 基于卷积神经网络的半监督迁移学习字符识别方法及系统 | |
CN104966104B (zh) | 一种基于三维卷积神经网络的视频分类方法 | |
CN105184303B (zh) | 一种基于多模态深度学习的图像标注方法 | |
CN104035996B (zh) | 基于Deep Learning的领域概念抽取方法 | |
CN106815604A (zh) | 基于多层信息融合的注视点检测方法 | |
CN108647595B (zh) | 基于多属性深度特征的车辆重识别方法 | |
CN110362723A (zh) | 一种题目特征表示方法、装置及存储介质 | |
Kye et al. | Meta-learned confidence for few-shot learning | |
CN110110726A (zh) | 电力设备铭牌识别方法、装置、计算机设备和存储介质 | |
CN109918642A (zh) | 基于委员会查询的主动学习框架的情感分析方法及系统 | |
CN109993201A (zh) | 一种图像处理方法、装置和可读存储介质 | |
CN106934392A (zh) | 基于多任务学习卷积神经网络的车标识别及属性预测方法 | |
CN107967497A (zh) | 基于卷积神经网络和极限学习机的手写体识别方法 | |
CN110245227A (zh) | 文本分类的融合分类器的训练方法及设备 | |
CN104915436A (zh) | 自适应多标签预测方法 | |
CN105164672A (zh) | 内容分类 | |
CN110263855A (zh) | 一种利用共基胶囊投影进行图像分类的方法 | |
CN110197213A (zh) | 基于神经网络的图像匹配方法、装置和设备 | |
CN113705215A (zh) | 一种基于元学习的大规模多标签文本分类方法 | |
CN110222737A (zh) | 一种基于长短时记忆网络的搜索引擎用户满意度评估方法 | |
CN106384125A (zh) | 面向偏标记数据的数字图像分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170208 |