CN109543730A - 信息流素材创意图片的分类方法 - Google Patents

信息流素材创意图片的分类方法 Download PDF

Info

Publication number
CN109543730A
CN109543730A CN201811330399.4A CN201811330399A CN109543730A CN 109543730 A CN109543730 A CN 109543730A CN 201811330399 A CN201811330399 A CN 201811330399A CN 109543730 A CN109543730 A CN 109543730A
Authority
CN
China
Prior art keywords
ring
picture
entropy
geomen
optimal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811330399.4A
Other languages
English (en)
Inventor
林正春
赵慧民
詹瑾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Original Mdt Infotech Ltd
Guangdong Polytechnic Normal University
Original Assignee
Guangdong Original Mdt Infotech Ltd
Guangdong Polytechnic Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Original Mdt Infotech Ltd, Guangdong Polytechnic Normal University filed Critical Guangdong Original Mdt Infotech Ltd
Priority to CN201811330399.4A priority Critical patent/CN109543730A/zh
Publication of CN109543730A publication Critical patent/CN109543730A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种信息流素材创意图片的分类方法,首先搜索该测试图像在每个环中最优或算法所能达到的最优位置,对于每个环,测试图像会插入使熵增加最小的位置,再通过比较所有环的熵增量,测试图片会添加到熵值增加最小的环所代表的分组即分类中,本发明借助熵描述符,可以更好的构造用于图片分类的熵环,通过最小化熵值获得最优环,此时图片将按语义顺序连接,对于很难分类的容易混淆的图片集仍能产生非常好的效果。

Description

信息流素材创意图片的分类方法
技术领域
本发明涉及图片分类领域,具体涉及一种信息流素材创意图片的分类方法。
背景技术
图片分类即基于图片内容对图片进行分类。过去的很多研究都是基于支持向量机(SVM)构建分类器,并取得了一定的成果。但是,要获得很高的图片分类正确率以及稳定性仍具有相当大的挑战。这部分是因为语义相关的图片可能并不是一个线性超平面的特征空间。
发明内容
本发明的目的是为解决上述不足,提供一种信息流素材创意图片的分类方法
本发明的目的是通过以下技术方案实现的:
一个方面,一种信息流素材创意图片的分类方法,其中,给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此我们仅仅考虑在一维曲线上GEOMEN的表示;
GEOMEN的空间分量用欧拉距离量度,其中,为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项可以修正噪声对曲率的影响;
如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加,每个类首先都需要通过训练获得一个最优环即该类别的模型,这样对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=arg minS(X,O)
通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签,分类的策略为在所有环中找到图片Q的最优位置,测试图片的类别即位最优位置所在环的类别。
另一方面,一种信息流素材创意图片的分类方法,包括:
给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环,每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,
GEOMEN的空间分量用欧拉距离量度,其中,为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项修正噪声对曲率的影响。
根据本公开的一个实施方式,仅考虑在一维曲线上GEOMEN的表示;
根据本公开的一个实施方式,如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加。
根据本公开的一个实施方式,每个类首先都需要通过训练获得一个最优环即该类别的模型。
根据本公开的一个实施方式,对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签。
为了找到最优环,需要最小化GEOMEN值,亦即:
O*=arg minS(X,O)。
根据本公开的一个实施方式,通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签。
根据本公开的一个实施方式,分类的策略为在所有环中找到图片Q的最优位置。
根据本公开的一个实施方式,测试图片的类别即位最优位置所在环的类别。
本发明具有如下有益的效果:
本发明借助熵描述符,可以更好的构造用于图片分类的熵环,通过最小化熵值获得最优环,此时图片将按语义顺序连接,对于很难分类的容易混淆的图片集仍能产生非常好的效果。
具体实施方式
下面对本发明作进一步的说明:
给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此我们仅仅考虑在一维曲线上GEOMEN的表示;
GEOMEN的空间分量用欧拉距离量度,其中,为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项可以修正噪声对曲率的影响;
如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加,每个类首先都需要通过训练获得一个最优环即该类别的模型,这样对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=arg minS(X,O)
通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签,分类的策略为在所有环中找到图片Q的最优位置,测试图片的类别即位最优位置所在环的类别。
如表1所示,对三个数据集进行了测试:UMIST人脸数据集,以及自制的背景杂乱的汽车数据集,飞机模型数据集。飞机模型数据集通过使用3DMAX软件对各种飞机模型进行旋转,并选取角度渲染投影成二维照片获得。
人脸数据集表明我们的算法框架中在人脸分析中具有很好的分类性能。同时,汽车数据集尽管背景杂乱,但仍具有较高正确率,更比SVM高出22.50%,表明该框架对背景的高稳定性。同时,对于飞机模型优异表现,表明该算法框架对于基于图片的模型检索的重大应用潜力。
表1
数据集 容量 类别数 GEMON SVM GEMON-SVM
人脸 360 13 97.52 85.84 12.72(-1.66)
车辆 450 15 93.54 71.04 22.5(-3.69)
飞机 2000 20 81.33 63.54 17.79(-1.01)
本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。

Claims (10)

1.一种信息流素材创意图片的分类方法,其特征在于,包括:给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环,每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此仅考虑在一维曲线上GEOMEN的表示;
GEOMEN的空间分量用欧拉距离量度,其中,为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项修正噪声对曲率的影响;
如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加,每个类首先都需要通过训练获得一个最优环即该类别的模型,这样对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=argminS(X,O)
通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签,分类的策略为在所有环中找到图片Q的最优位置,测试图片的类别即位最优位置所在环的类别。
2.一种信息流素材创意图片的分类方法,其特征在于,包括:
给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环,每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,
GEOMEN的空间分量用欧拉距离量度,其中,为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项修正噪声对曲率的影响。
3.如权利要求2所述的方法,其特征在于,仅考虑在一维曲线上GEOMEN的表示;
4.如权利要求2所述的方法,其特征在于,如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加。
5.如权利要求4所述的方法,其特征在于,每个类首先都需要通过训练获得一个最优环即该类别的模型。
6.如权利要求5所述的方法,其特征在于,对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签。
7.如权利要求6所述的方法,其特征在于,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=argminS(X,O)。
8.如权利要求7所述的方法,其特征在于,通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签。
9.如权利要求8所述的方法,其特征在于,分类的策略为在所有环中找到图片Q的最优位置。
10.如权利要求9所述的方法,其特征在于,测试图片的类别即位最优位置所在环的类别。
CN201811330399.4A 2018-11-09 2018-11-09 信息流素材创意图片的分类方法 Pending CN109543730A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811330399.4A CN109543730A (zh) 2018-11-09 2018-11-09 信息流素材创意图片的分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811330399.4A CN109543730A (zh) 2018-11-09 2018-11-09 信息流素材创意图片的分类方法

Publications (1)

Publication Number Publication Date
CN109543730A true CN109543730A (zh) 2019-03-29

Family

ID=65846485

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811330399.4A Pending CN109543730A (zh) 2018-11-09 2018-11-09 信息流素材创意图片的分类方法

Country Status (1)

Country Link
CN (1) CN109543730A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647826A (zh) * 2019-09-05 2020-01-03 北京百度网讯科技有限公司 商品训练图片的获取方法、装置、计算机设备和存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140376804A1 (en) * 2013-06-21 2014-12-25 Xerox Corporation Label-embedding view of attribute-based recognition
CN105808752A (zh) * 2016-03-10 2016-07-27 大连理工大学 一种基于cca和2pknn的自动图像标注方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140376804A1 (en) * 2013-06-21 2014-12-25 Xerox Corporation Label-embedding view of attribute-based recognition
CN105808752A (zh) * 2016-03-10 2016-07-27 大连理工大学 一种基于cca和2pknn的自动图像标注方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘会波: "基于几何流形熵的图片分类方法研究", 《科技传播》 *
季敏惠: "快速禁忌搜索研究及其在图片获取中的应用", 《万方数据库》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110647826A (zh) * 2019-09-05 2020-01-03 北京百度网讯科技有限公司 商品训练图片的获取方法、装置、计算机设备和存储介质
CN110647826B (zh) * 2019-09-05 2022-04-29 北京百度网讯科技有限公司 商品训练图片的获取方法、装置、计算机设备和存储介质
US11599743B2 (en) 2019-09-05 2023-03-07 Beijing Baidu Netcom Science Technology Co., Ltd. Method and apparatus for obtaining product training images, and non-transitory computer-readable storage medium

Similar Documents

Publication Publication Date Title
Wu et al. Wasserstein divergence for gans
US20160314338A1 (en) Method and apparatus for fingerprint identification
CN105760886B (zh) 一种基于目标识别与显著性检测的图像场景多对象分割方法
Prakasa Texture feature extraction by using local binary pattern
CN105931253B (zh) 一种基于半监督学习相结合的图像分割方法
Duque-Arias et al. On power Jaccard losses for semantic segmentation
CN104298990B (zh) 一种基于骨架图的快速图形匹配与识别的方法
CN110223310B (zh) 一种基于深度学习的线结构光中心线和箱体边缘检测方法
US20180165540A1 (en) Image object retrieval
CN102663431A (zh) 一种基于区域加权的图像匹配计算方法
CN108961301B (zh) 一种基于无监督逐像素分类的角毛藻图像分割方法
CN107392968A (zh) 融合颜色对比图和颜色空间分布图的图像显著性检测方法
Zhu et al. Deep residual text detection network for scene text
CN102663401A (zh) 一种图像特征提取和描述方法
Yuan et al. Superpixels with content-adaptive criteria
JP2012043436A (ja) 対象検出装置、対象検出方法、分類器作成装置及び分類器作成方法
CN109543730A (zh) 信息流素材创意图片的分类方法
CN106557526B (zh) 处理图像的装置和方法
CN103136536A (zh) 对象检测系统和方法、图像的特征提取方法
CN110728214B (zh) 一种基于尺度匹配的弱小人物目标检测方法
CN105512682B (zh) 一种基于Krawtchouk矩和KNN-SMO分类器的密级标识识别方法
CN109214275B (zh) 一种基于深度学习的低俗图片识别方法
CN105205487B (zh) 一种图片处理方法及装置
WO2019218313A1 (zh) 一种递进式动态高光谱图像分类方法
CN106651864B (zh) 一种面向高分辨率遥感图像的分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190329