CN109543730A - 信息流素材创意图片的分类方法 - Google Patents
信息流素材创意图片的分类方法 Download PDFInfo
- Publication number
- CN109543730A CN109543730A CN201811330399.4A CN201811330399A CN109543730A CN 109543730 A CN109543730 A CN 109543730A CN 201811330399 A CN201811330399 A CN 201811330399A CN 109543730 A CN109543730 A CN 109543730A
- Authority
- CN
- China
- Prior art keywords
- ring
- picture
- entropy
- geomen
- optimal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种信息流素材创意图片的分类方法,首先搜索该测试图像在每个环中最优或算法所能达到的最优位置,对于每个环,测试图像会插入使熵增加最小的位置,再通过比较所有环的熵增量,测试图片会添加到熵值增加最小的环所代表的分组即分类中,本发明借助熵描述符,可以更好的构造用于图片分类的熵环,通过最小化熵值获得最优环,此时图片将按语义顺序连接,对于很难分类的容易混淆的图片集仍能产生非常好的效果。
Description
技术领域
本发明涉及图片分类领域,具体涉及一种信息流素材创意图片的分类方法。
背景技术
图片分类即基于图片内容对图片进行分类。过去的很多研究都是基于支持向量机(SVM)构建分类器,并取得了一定的成果。但是,要获得很高的图片分类正确率以及稳定性仍具有相当大的挑战。这部分是因为语义相关的图片可能并不是一个线性超平面的特征空间。
发明内容
本发明的目的是为解决上述不足,提供一种信息流素材创意图片的分类方法
本发明的目的是通过以下技术方案实现的:
一个方面,一种信息流素材创意图片的分类方法,其中,给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此我们仅仅考虑在一维曲线上GEOMEN的表示;
GEOMEN的空间分量用欧拉距离量度,其中,与为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项可以修正噪声对曲率的影响;
如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加,每个类首先都需要通过训练获得一个最优环即该类别的模型,这样对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=arg minS(X,O)
通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签,分类的策略为在所有环中找到图片Q的最优位置,测试图片的类别即位最优位置所在环的类别。
另一方面,一种信息流素材创意图片的分类方法,包括:
给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环,每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,
GEOMEN的空间分量用欧拉距离量度,其中,与为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项修正噪声对曲率的影响。
根据本公开的一个实施方式,仅考虑在一维曲线上GEOMEN的表示;
根据本公开的一个实施方式,如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加。
根据本公开的一个实施方式,每个类首先都需要通过训练获得一个最优环即该类别的模型。
根据本公开的一个实施方式,对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签。
为了找到最优环,需要最小化GEOMEN值,亦即:
O*=arg minS(X,O)。
根据本公开的一个实施方式,通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签。
根据本公开的一个实施方式,分类的策略为在所有环中找到图片Q的最优位置。
根据本公开的一个实施方式,测试图片的类别即位最优位置所在环的类别。
本发明具有如下有益的效果:
本发明借助熵描述符,可以更好的构造用于图片分类的熵环,通过最小化熵值获得最优环,此时图片将按语义顺序连接,对于很难分类的容易混淆的图片集仍能产生非常好的效果。
具体实施方式
下面对本发明作进一步的说明:
给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环。每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此我们仅仅考虑在一维曲线上GEOMEN的表示;
GEOMEN的空间分量用欧拉距离量度,其中,与为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项可以修正噪声对曲率的影响;
如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加,每个类首先都需要通过训练获得一个最优环即该类别的模型,这样对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=arg minS(X,O)
通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签,分类的策略为在所有环中找到图片Q的最优位置,测试图片的类别即位最优位置所在环的类别。
如表1所示,对三个数据集进行了测试:UMIST人脸数据集,以及自制的背景杂乱的汽车数据集,飞机模型数据集。飞机模型数据集通过使用3DMAX软件对各种飞机模型进行旋转,并选取角度渲染投影成二维照片获得。
人脸数据集表明我们的算法框架中在人脸分析中具有很好的分类性能。同时,汽车数据集尽管背景杂乱,但仍具有较高正确率,更比SVM高出22.50%,表明该框架对背景的高稳定性。同时,对于飞机模型优异表现,表明该算法框架对于基于图片的模型检索的重大应用潜力。
表1
数据集 | 容量 | 类别数 | GEMON | SVM | GEMON-SVM |
人脸 | 360 | 13 | 97.52 | 85.84 | 12.72(-1.66) |
车辆 | 450 | 15 | 93.54 | 71.04 | 22.5(-3.69) |
飞机 | 2000 | 20 | 81.33 | 63.54 | 17.79(-1.01) |
本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。
Claims (10)
1.一种信息流素材创意图片的分类方法,其特征在于,包括:给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环,每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,但实际情况下这是一条曲线,因此仅考虑在一维曲线上GEOMEN的表示;
GEOMEN的空间分量用欧拉距离量度,其中,与为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项修正噪声对曲率的影响;
如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加,每个类首先都需要通过训练获得一个最优环即该类别的模型,这样对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=argminS(X,O)
通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签,分类的策略为在所有环中找到图片Q的最优位置,测试图片的类别即位最优位置所在环的类别。
2.一种信息流素材创意图片的分类方法,其特征在于,包括:
给定一个图片特征向量的集合,X={xi|xi∈Rm,i=1,2,...,n},首先定义一个长度为n的闭合且无自相交的环,每个在该环中得向量都与邻居相连,其对应的连接顺序O可以描述为:{o1,o2,o3,...,on,o1},其中每一项对应向量的索引,这样集合X的在顺序O下的GEOMEN值为环上各点熵值的平均值,即:
且各s(X,O,i)为两分量加权和:空间分量p(X,O,i)和几何分量g(X,O,i)如下:
s(X,O,i)=ap(X,O,i)+g(X,O,i)
上式a是用来修正空间分量对GEOMEN的贡献大小;GEOMEN表征按照顺序O连接的环的平滑程度,另外,它也是在数据近似性的量度,因为图片排序可以被看做提取一维流行的问题,
GEOMEN的空间分量用欧拉距离量度,其中,与为环O中得相邻项;几何分量由两部分组成:曲线曲率k和正则项ρ,即:
引入正则项修正噪声对曲率的影响。
3.如权利要求2所述的方法,其特征在于,仅考虑在一维曲线上GEOMEN的表示;
4.如权利要求2所述的方法,其特征在于,如果两个类别有一个明显的区别,那么在边界点处熵值便会极大的增加。
5.如权利要求4所述的方法,其特征在于,每个类首先都需要通过训练获得一个最优环即该类别的模型。
6.如权利要求5所述的方法,其特征在于,对于待预测图片,通过比较其插入每个最优环的熵增即可获得该图片的分类标签。
7.如权利要求6所述的方法,其特征在于,为了找到最优环,需要最小化GEOMEN值,亦即:
O*=argminS(X,O)。
8.如权利要求7所述的方法,其特征在于,通过简单的禁忌搜索算法获得熵的全局最小值,每个类的最优环实际上训练图片的提取模型,用于获取测试未知图片的类别标签。
9.如权利要求8所述的方法,其特征在于,分类的策略为在所有环中找到图片Q的最优位置。
10.如权利要求9所述的方法,其特征在于,测试图片的类别即位最优位置所在环的类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811330399.4A CN109543730A (zh) | 2018-11-09 | 2018-11-09 | 信息流素材创意图片的分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811330399.4A CN109543730A (zh) | 2018-11-09 | 2018-11-09 | 信息流素材创意图片的分类方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109543730A true CN109543730A (zh) | 2019-03-29 |
Family
ID=65846485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811330399.4A Pending CN109543730A (zh) | 2018-11-09 | 2018-11-09 | 信息流素材创意图片的分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109543730A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647826A (zh) * | 2019-09-05 | 2020-01-03 | 北京百度网讯科技有限公司 | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140376804A1 (en) * | 2013-06-21 | 2014-12-25 | Xerox Corporation | Label-embedding view of attribute-based recognition |
CN105808752A (zh) * | 2016-03-10 | 2016-07-27 | 大连理工大学 | 一种基于cca和2pknn的自动图像标注方法 |
-
2018
- 2018-11-09 CN CN201811330399.4A patent/CN109543730A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140376804A1 (en) * | 2013-06-21 | 2014-12-25 | Xerox Corporation | Label-embedding view of attribute-based recognition |
CN105808752A (zh) * | 2016-03-10 | 2016-07-27 | 大连理工大学 | 一种基于cca和2pknn的自动图像标注方法 |
Non-Patent Citations (2)
Title |
---|
刘会波: "基于几何流形熵的图片分类方法研究", 《科技传播》 * |
季敏惠: "快速禁忌搜索研究及其在图片获取中的应用", 《万方数据库》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647826A (zh) * | 2019-09-05 | 2020-01-03 | 北京百度网讯科技有限公司 | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
CN110647826B (zh) * | 2019-09-05 | 2022-04-29 | 北京百度网讯科技有限公司 | 商品训练图片的获取方法、装置、计算机设备和存储介质 |
US11599743B2 (en) | 2019-09-05 | 2023-03-07 | Beijing Baidu Netcom Science Technology Co., Ltd. | Method and apparatus for obtaining product training images, and non-transitory computer-readable storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | Wasserstein divergence for gans | |
US20160314338A1 (en) | Method and apparatus for fingerprint identification | |
CN105760886B (zh) | 一种基于目标识别与显著性检测的图像场景多对象分割方法 | |
Prakasa | Texture feature extraction by using local binary pattern | |
CN105931253B (zh) | 一种基于半监督学习相结合的图像分割方法 | |
Duque-Arias et al. | On power Jaccard losses for semantic segmentation | |
CN104298990B (zh) | 一种基于骨架图的快速图形匹配与识别的方法 | |
CN110223310B (zh) | 一种基于深度学习的线结构光中心线和箱体边缘检测方法 | |
US20180165540A1 (en) | Image object retrieval | |
CN102663431A (zh) | 一种基于区域加权的图像匹配计算方法 | |
CN108961301B (zh) | 一种基于无监督逐像素分类的角毛藻图像分割方法 | |
CN107392968A (zh) | 融合颜色对比图和颜色空间分布图的图像显著性检测方法 | |
Zhu et al. | Deep residual text detection network for scene text | |
CN102663401A (zh) | 一种图像特征提取和描述方法 | |
Yuan et al. | Superpixels with content-adaptive criteria | |
JP2012043436A (ja) | 対象検出装置、対象検出方法、分類器作成装置及び分類器作成方法 | |
CN109543730A (zh) | 信息流素材创意图片的分类方法 | |
CN106557526B (zh) | 处理图像的装置和方法 | |
CN103136536A (zh) | 对象检测系统和方法、图像的特征提取方法 | |
CN110728214B (zh) | 一种基于尺度匹配的弱小人物目标检测方法 | |
CN105512682B (zh) | 一种基于Krawtchouk矩和KNN-SMO分类器的密级标识识别方法 | |
CN109214275B (zh) | 一种基于深度学习的低俗图片识别方法 | |
CN105205487B (zh) | 一种图片处理方法及装置 | |
WO2019218313A1 (zh) | 一种递进式动态高光谱图像分类方法 | |
CN106651864B (zh) | 一种面向高分辨率遥感图像的分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190329 |