CN109543730A

CN109543730A - 信息流素材创意图片的分类方法

Info

Publication number: CN109543730A
Application number: CN201811330399.4A
Authority: CN
Inventors: 林正春; 赵慧民; 詹瑾
Original assignee: Guangdong Original Mdt Infotech Ltd; Guangdong Polytechnic Normal University
Current assignee: Guangdong Original Mdt Infotech Ltd; Guangdong Polytechnic Normal University
Priority date: 2018-11-09
Filing date: 2018-11-09
Publication date: 2019-03-29

Abstract

本发明公开了一种信息流素材创意图片的分类方法，首先搜索该测试图像在每个环中最优或算法所能达到的最优位置，对于每个环，测试图像会插入使熵增加最小的位置，再通过比较所有环的熵增量，测试图片会添加到熵值增加最小的环所代表的分组即分类中，本发明借助熵描述符，可以更好的构造用于图片分类的熵环，通过最小化熵值获得最优环，此时图片将按语义顺序连接，对于很难分类的容易混淆的图片集仍能产生非常好的效果。

Description

信息流素材创意图片的分类方法

技术领域

本发明涉及图片分类领域，具体涉及一种信息流素材创意图片的分类方法。

背景技术

图片分类即基于图片内容对图片进行分类。过去的很多研究都是基于支持向量机(SVM)构建分类器，并取得了一定的成果。但是，要获得很高的图片分类正确率以及稳定性仍具有相当大的挑战。这部分是因为语义相关的图片可能并不是一个线性超平面的特征空间。

发明内容

本发明的目的是为解决上述不足，提供一种信息流素材创意图片的分类方法

本发明的目的是通过以下技术方案实现的：

一个方面，一种信息流素材创意图片的分类方法，其中，给定一个图片特征向量的集合，X＝{x_i|x_i∈R^m,i＝1,2,...,n}，首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连，其对应的连接顺序O可以描述为：{o₁,o₂,o₃,...,o_n,o₁}，其中每一项对应向量的索引，这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值，即：

且各s(X,O,i)为两分量加权和：空间分量p(X,O,i)和几何分量g(X,O,i)如下：

s(X,O,i)＝ap(X,O,i)+g(X,O,i)

上式a是用来修正空间分量对GEOMEN的贡献大小；GEOMEN表征按照顺序O连接的环的平滑程度，另外，它也是在数据近似性的量度，因为图片排序可以被看做提取一维流行的问题，但实际情况下这是一条曲线，因此我们仅仅考虑在一维曲线上GEOMEN的表示；

GEOMEN的空间分量用欧拉距离量度，其中，与为环O中得相邻项；几何分量由两部分组成：曲线曲率k和正则项ρ，即：

引入正则项可以修正噪声对曲率的影响；

如果两个类别有一个明显的区别，那么在边界点处熵值便会极大的增加，每个类首先都需要通过训练获得一个最优环即该类别的模型，这样对于待预测图片，通过比较其插入每个最优环的熵增即可获得该图片的分类标签，为了找到最优环，需要最小化GEOMEN值，亦即：

O^*＝arg minS(X,O)

通过简单的禁忌搜索算法获得熵的全局最小值，每个类的最优环实际上训练图片的提取模型，用于获取测试未知图片的类别标签，分类的策略为在所有环中找到图片Q的最优位置，测试图片的类别即位最优位置所在环的类别。

另一方面，一种信息流素材创意图片的分类方法，包括：

给定一个图片特征向量的集合，X＝{x_i|x_i∈R^m,i＝1,2,...,n}，首先定义一个长度为n的闭合且无自相交的环，每个在该环中得向量都与邻居相连，其对应的连接顺序O可以描述为：{o₁,o₂,o₃,...,o_n,o₁}，其中每一项对应向量的索引，这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值，即：

s(X,O,i)＝ap(X,O,i)+g(X,O,i)

上式a是用来修正空间分量对GEOMEN的贡献大小；GEOMEN表征按照顺序O连接的环的平滑程度，另外，它也是在数据近似性的量度，因为图片排序可以被看做提取一维流行的问题，

引入正则项修正噪声对曲率的影响。

根据本公开的一个实施方式，仅考虑在一维曲线上GEOMEN的表示；

根据本公开的一个实施方式，如果两个类别有一个明显的区别，那么在边界点处熵值便会极大的增加。

根据本公开的一个实施方式，每个类首先都需要通过训练获得一个最优环即该类别的模型。

根据本公开的一个实施方式，对于待预测图片，通过比较其插入每个最优环的熵增即可获得该图片的分类标签。

为了找到最优环，需要最小化GEOMEN值，亦即：

O^*＝arg minS(X,O)。

根据本公开的一个实施方式，通过简单的禁忌搜索算法获得熵的全局最小值，每个类的最优环实际上训练图片的提取模型，用于获取测试未知图片的类别标签。

根据本公开的一个实施方式，分类的策略为在所有环中找到图片Q的最优位置。

根据本公开的一个实施方式，测试图片的类别即位最优位置所在环的类别。

本发明具有如下有益的效果：

本发明借助熵描述符，可以更好的构造用于图片分类的熵环，通过最小化熵值获得最优环，此时图片将按语义顺序连接，对于很难分类的容易混淆的图片集仍能产生非常好的效果。

具体实施方式

下面对本发明作进一步的说明：

给定一个图片特征向量的集合，X＝{x_i|x_i∈R^m,i＝1,2,...,n}，首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连，其对应的连接顺序O可以描述为：{o₁,o₂,o₃,...,o_n,o₁}，其中每一项对应向量的索引，这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值，即：

s(X,O,i)＝ap(X,O,i)+g(X,O,i)

引入正则项可以修正噪声对曲率的影响；

O^*＝arg minS(X,O)

如表1所示，对三个数据集进行了测试：UMIST人脸数据集，以及自制的背景杂乱的汽车数据集，飞机模型数据集。飞机模型数据集通过使用3DMAX软件对各种飞机模型进行旋转，并选取角度渲染投影成二维照片获得。

人脸数据集表明我们的算法框架中在人脸分析中具有很好的分类性能。同时，汽车数据集尽管背景杂乱，但仍具有较高正确率，更比SVM高出22.50％，表明该框架对背景的高稳定性。同时，对于飞机模型优异表现，表明该算法框架对于基于图片的模型检索的重大应用潜力。

表1

数据集	容量	类别数	GEMON	SVM	GEMON-SVM
						人脸	360	13	97.52	85.84	12.72(-1.66)
车辆	450	15	93.54	71.04	22.5(-3.69)
						飞机	2000	20	81.33	63.54	17.79(-1.01)

本领域的技术人员应当理解，上述实施方式仅仅是为了清楚地说明本公开，而并非是对本公开的范围进行限定。对于所属领域的技术人员而言，在上述公开的基础上还可以做出其它变化或变型，并且这些变化或变型仍处于本公开的范围内。

Claims

1.一种信息流素材创意图片的分类方法，其特征在于，包括：给定一个图片特征向量的集合，X＝{x_i|x_i∈R^m,i＝1,2,...,n}，首先定义一个长度为n的闭合且无自相交的环，每个在该环中得向量都与邻居相连，其对应的连接顺序O可以描述为：{o₁,o₂,o₃,...,o_n,o₁}，其中每一项对应向量的索引，这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值，即：

s(X,O,i)＝ap(X,O,i)+g(X,O,i)

上式a是用来修正空间分量对GEOMEN的贡献大小；GEOMEN表征按照顺序O连接的环的平滑程度，另外，它也是在数据近似性的量度，因为图片排序可以被看做提取一维流行的问题，但实际情况下这是一条曲线，因此仅考虑在一维曲线上GEOMEN的表示；

引入正则项修正噪声对曲率的影响；

O^*＝argminS(X,O)

2.一种信息流素材创意图片的分类方法，其特征在于，包括：

s(X,O,i)＝ap(X,O,i)+g(X,O,i)

引入正则项修正噪声对曲率的影响。

3.如权利要求2所述的方法，其特征在于，仅考虑在一维曲线上GEOMEN的表示；

4.如权利要求2所述的方法，其特征在于，如果两个类别有一个明显的区别，那么在边界点处熵值便会极大的增加。

5.如权利要求4所述的方法，其特征在于，每个类首先都需要通过训练获得一个最优环即该类别的模型。

6.如权利要求5所述的方法，其特征在于，对于待预测图片，通过比较其插入每个最优环的熵增即可获得该图片的分类标签。

7.如权利要求6所述的方法，其特征在于，为了找到最优环，需要最小化GEOMEN值，亦即：

O^*＝argminS(X,O)。

8.如权利要求7所述的方法，其特征在于，通过简单的禁忌搜索算法获得熵的全局最小值，每个类的最优环实际上训练图片的提取模型，用于获取测试未知图片的类别标签。

9.如权利要求8所述的方法，其特征在于，分类的策略为在所有环中找到图片Q的最优位置。

10.如权利要求9所述的方法，其特征在于，测试图片的类别即位最优位置所在环的类别。