CN107301426A

CN107301426A - 一种鞋底花纹图像的多标签聚类方法

Info

Publication number: CN107301426A
Application number: CN201710446061.4A
Authority: CN
Inventors: 王新年; 朱悦; 王加丽
Original assignee: Dalian Maritime University
Current assignee: Dalian Maritime University
Priority date: 2017-06-14
Filing date: 2017-06-14
Publication date: 2017-10-27
Anticipated expiration: 2037-06-14
Also published as: CN107301426B

Abstract

本发明公开了一种鞋底花纹图像的多标签聚类方法，包括以下步骤：选取鞋底花纹图像库中各个图像的基元图像，并计算基元图像的特征选取代表图，统计得到鞋印图像库的语义词汇表；根据语义词汇表，运用PLSA模型计算鞋底花纹图像‑潜在语义主题之间的概率矩阵，去除重复的主题得到最终的概率矩阵；根据不同鞋底花纹图像属于相同潜在语义主题可能性的大小，对鞋印图像库进行单标签聚类；根据最初概率矩阵和索引矩阵，实现鞋底花纹图像的多标签聚类。本发明将鞋印图像划分为基元图像进行处理，并且考虑鞋底花纹图像之间关联性的同时也考虑了类别间的关联性，是鞋底花纹图像多标签分类的基础，可以在一定程度上提高鞋底花纹图像识别和检索的正确率。

Description

一种鞋底花纹图像的多标签聚类方法

技术领域

本发明属于数据处理技术领域，具体涉及一种鞋底花纹图像的多标签聚类方法。

背景技术

目前多标签聚类多用在文本数据集中，主要由以下两种：

1、基于模糊的多标签文本聚类方法，主要思路为：利用Wordnet选取上义词扩充核心单词，通过大量参数及阈值的设定构建候选簇，分析候选簇与其成员相似度，最后完成多标签分类。参考文献见Chen C L,Frank S C,Tseng B,Tyne L.An integration ofWordNet and fuzzy association rule mining for multi-label documentclustering.Data&Knowledge Engineering.2010,60:1208-1226。

2、基于词汇链的多标签文本聚类方法，该方法的主要思路是：结合WordNet的方法构造词汇链特征空间，并利用词汇链之间的语义相似度构造数据集的聚类图模型，实现文本数据的多标签划分。参考文献见Deodhare D,Sharma G,Srivastava A etal.Semantically driven soft-clustering of documents using lexicalchains.International Conference onNatural Language Processing.2010。

对于相似度较高的鞋底花纹图像，一个鞋印图像很难确切地分辨处于属于哪一类，同时由于磨损、残缺现象的存在，一个鞋印图像的多标签现象必然存在。目前还没有鞋底花纹图像多标签聚类方法报道。由于目前文本数据的多标签聚类方法过分依赖于文本中已知的信息，不适用于鞋底花纹图像，若将其直接应用于鞋底花纹图像多标签聚类，聚类效果不好。

发明内容

为解决现有技术存在的上述问题，本发明要设计一种适用于鞋底花纹且聚类效果好的鞋底花纹图像的多标签聚类方法。

为了实现上述目的，本发明的技术方案如下：一种鞋底花纹图像的多标签聚类方法，包括以下步骤：

A、选取鞋底花纹图像库中各个图像的基元图像，并计算基元图像的特征选取代表图，统计得到鞋印图像库的语义词汇表L_n×c。

A1、根据鞋底花纹制作工艺，预先定义鞋底花纹基元的类别及其代表图像，并自动提取代表代表图像的小波-傅里叶梅林变换特征。

A2、根据鞋底花纹图像的连通特性，将鞋底花纹图像划分为不同区域。选取面积即像素点个数大于阈值th₁的连通区域，取其外接矩形作为目标区域，即基元图像。

A3、对于每幅鞋底花纹图像的基元图像，提取小波-傅里叶梅林变换特征，并与不同语义类别中的代表图像做比较，然后根据比较结果将基元图像划分到不同的语义类别中。

A4、汇集所有语义类别合成语义词汇表L_n×c，其中，n为鞋印图像库图像总个数，c为基元图像的个数。

B、根据语义词汇表L_n×c，运用PLSA模型计算鞋底花纹图像-潜在语义主题之间的概率矩阵，去除重复的主题得到最终的概率矩阵P(z|d)。

B1、设定不同的潜在语义主题个数，对语义词汇表L_n×c运用PLSA模型并利用EM算法进行模型优化和拟合，得到鞋底花纹图像-潜在语义主题之间的联合概率矩阵。其中，将每幅鞋底花纹图像看作一个单独的文档，用d来表示，而视觉词汇即基元图像就看作文档中的词汇，潜在语义主题用z表示。

B2、确定重复主题。所有鞋底花纹图像在两个不同潜在语义主题上的概率分布差别小于阈值th₂，这两个潜在语义主题就被称为重复主题，即|z_i-z_j|＜th₂，其中z_i、z_j为所有鞋底花纹图像在两个不同潜在语义主题z_i、z_j上的概率分布。

B3、去除重复主题。将每幅鞋底花纹图像属于重复主题概率的平均值作为该鞋底花纹图像属于新主题的概率，得到最终的概率矩阵P(z|d)。

C、根据不同鞋底花纹图像属于相同潜在语义主题可能性的大小，对鞋印图像库进行单标签聚类。

C1、将概率矩阵P(z|d)按照同一鞋底花纹图像属于各个潜在语义主题的可能性从大到小排序，得到矩阵P₀和矩阵I₀,其中，P₀的每列是鞋底花纹图像属于各个潜在语义主题可能性从大到小的排序，p_i,k是指第i幅鞋底花纹图像d_i概率排名第k的潜在语义主题的概率；I₀是对应潜在语义主题的索引，I_i,k是指第i幅鞋底花纹图像d_i概率排名第k的潜在语义主题的索引。

C2、以每幅鞋底花纹图像作为处理对象，将潜在语义主题排名前两名中有相同主题，并且属于该主题的概率大于阈值th₃的所有鞋底花纹图像聚为一类，将没有处理的鞋底花纹图像每幅图像看作一个类别，得到聚类结果C₁、C₂…C_i…,即：

C3、更新概率矩阵和索引矩阵。去除每幅鞋底花纹图像排名前两名的潜在语义主题的概率和索引，得到新的概率矩阵P和索引矩阵I。

C4、以每个类别作为处理对象，将潜在语义主题排名前两名中有相同主题，并且属于该主题的概率大于阈值th₃的所有类别聚为一类，仍然将没有处理的鞋底花纹图像每幅图像看作一个类别，更新聚类结果C₁'、C₂'…C_i'…,即：

C5、用C₁'、C₂'…C_i'…代替C₁、C₂…C_i…，并将C₁'、C₂'…C_i'…将命名为C₁、C₂…C_i…。

C6、重复步骤C3-C5，直到矩阵P的最大值p_max小于阈值th₃，得到最后更新单标签聚类结果C₁、C₂…C_i…。

D、根据最初概率矩阵P₀和索引矩阵I₀，将C₁、C₂…C_i…进行处理，实现鞋底花纹图像的多标签聚类。

D1、更新概率矩阵和索引矩阵。根据最初概率矩阵P₀和索引矩阵I₀，按照从大到小的顺序重新排列各个类别中所有鞋底花纹图像潜在语义主题的可能性，得到新的概率矩阵CP和索引矩阵CI。

D2、找到各个类别的代表潜在语义主题z*及其概率p(z*|C)。类别的代表潜在语义主题为该类别排名前th₄个中出现次数最多的主题，其概率是所有类别成员属于该主题概率的平均值，即：

式中，N为z*在C_i出现的次数。

D3、处理具有相同代表潜在语义主题的类别。找到具有相同代表潜在语义主题的类别，并将这些类别按照代表潜在语义主题的概率由大到小进行排序，将排序后的类别两两依次按如下方式进行处理。假定R₁、R₂、R₃是具有相同代表潜在语义主题z^*的类别排序后的结果，p₁、p₂、p₃是z^*对应于各个类别的概率。首先比较p₁和p₂，如果p₁和p₂都大于th₅并且p₁-p₂＜th₆，将两个类别合并，并保留成员个数较少的类别，即：

R₁＝R₁∪R₂

R₂更新为原R₁或R₂中成员个数较少的一个；然后比较p₁和p₃，如果p₁和p₃都大于th₅并且：

p₁-p₃＜th₆

则：

R₁＝R₁∪R₃

R₃更新为原R₁或R₃中成员个数较少的一个；最后比较p₂和p₃，如果p₂和p₃都大于th₅并且：

p₂-p₃＜th₆

则：

R₂＝R₂∪R₃

R₃更新为原R₂或R₃中成员个数较少的一个，依此类推，将代表潜在语义主题为z^*的各类别中各个成员重新标记完。

D4、对所有具有相同代表潜在语义主题的类别进行步骤D3操作，得到鞋印图像库多标签聚类结果D₁、D₂…D_i…。

进一步地，步骤A1中所述的类别包括波型、折型、格型、块型、圆型、圆环型、椭圆型、类圆型、交织型、线型、图画型、角型、三角型、文字型和散杂型。

与现有技术相比，本发明具有以下有益效果：

1、本发明将鞋印图像划分为基元图像进行处理，并且考虑鞋底花纹图像之间关联性的同时也考虑了类别间的关联性，是鞋底花纹图像多标签分类的基础，同时可以在一定程度上提高鞋底花纹图像识别和检索的正确率。

2、本发明首次提出鞋底花纹图像多标签聚类方法，解决了以往单标签聚类的硬划分问题，更符合人的认知。

附图说明

图1是本发明的流程示意图。

具体实施方式

下面结合附图对本发明进行进一步地描述。本发明的流程如图1所示，以下对方法中用到的阈值解释如下：

阈值th₁是为了区分基元图像与噪声图像，取值范围在200到400之间；阈值th₂用来判定同类潜在语义主题，减少计算量，取值范围在0.1左右；阈值th₃判断图像是否为一类，取值0.75～0.85；阈值th₄用于确定类别的代表主题，取值范围为100～200；阈值th₅和阈值th₆确定类别间的关系，阈值th₅取值范围为0.5～0.6，阈值th₆取值为0.1。

方法中用到的PLSA模型的全称为概率潜语义分析模型，EM算法的全称为最大期望算法。

本发明不局限于本实施例，任何在本发明披露的技术范围内的等同构思或者改变，均列为本发明的保护范围。

Claims

1.一种鞋底花纹图像的多标签聚类方法，其特征在于：包括以下步骤：

A、选取鞋底花纹图像库中各个图像的基元图像，并计算基元图像的特征选取代表图，统计得到鞋印图像库的语义词汇表L_n×c；

A1、根据鞋底花纹制作工艺，预先定义鞋底花纹基元的类别及其代表图像，并自动提取代表代表图像的小波-傅里叶梅林变换特征；

A2、根据鞋底花纹图像的连通特性，将鞋底花纹图像划分为不同区域；选取面积即像素点个数大于阈值th₁的连通区域，取其外接矩形作为目标区域，即基元图像；

A3、对于每幅鞋底花纹图像的基元图像，提取小波-傅里叶梅林变换特征，并与不同语义类别中的代表图像做比较，然后根据比较结果将基元图像划分到不同的语义类别中；

A4、汇集所有语义类别合成语义词汇表L_n×c，其中，n为鞋印图像库图像总个数，c为基元图像的个数；

B、根据语义词汇表L_n×c，运用PLSA模型计算鞋底花纹图像-潜在语义主题之间的概率矩阵，去除重复的主题得到最终的概率矩阵P(z|d)；

B1、设定不同的潜在语义主题个数，对语义词汇表L_n×c运用PLSA模型并利用EM算法进行模型优化和拟合，得到鞋底花纹图像-潜在语义主题之间的联合概率矩阵；其中，将每幅鞋底花纹图像看作一个单独的文档，用d来表示，而视觉词汇即基元图像就看作文档中的词汇，潜在语义主题用z表示；

B2、确定重复主题；所有鞋底花纹图像在两个不同潜在语义主题上的概率分布差别小于阈值th₂，这两个潜在语义主题就被称为重复主题，即|z_i-z_j|＜th₂，其中z_i、z_j为所有鞋底花纹图像在两个不同潜在语义主题z_i、z_j上的概率分布；

B3、去除重复主题；将每幅鞋底花纹图像属于重复主题概率的平均值作为该鞋底花纹图像属于新主题的概率，得到最终的概率矩阵P(z|d)；

C、根据不同鞋底花纹图像属于相同潜在语义主题可能性的大小，对鞋印图像库进行单标签聚类；

C1、将概率矩阵P(z|d)按照同一鞋底花纹图像属于各个潜在语义主题的可能性从大到小排序，得到矩阵P₀和矩阵I₀,其中，P₀的每列是鞋底花纹图像属于各个潜在语义主题可能性从大到小的排序，p_i,k是指第i幅鞋底花纹图像d_i概率排名第k的潜在语义主题的概率；I₀是对应潜在语义主题的索引，I_i,k是指第i幅鞋底花纹图像d_i概率排名第k的潜在语义主题的索引；

C3、更新概率矩阵和索引矩阵；去除每幅鞋底花纹图像排名前两名的潜在语义主题的概率和索引，得到新的概率矩阵P和索引矩阵I；

<mrow> <msup> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>&prime;</mo> </msup> <mo>=</mo> <mrow> <mo>(</mo> <munder> <mrow> <mi></mi> <mo>&cup;</mo> </mrow> <mrow> <msub> <mi>p</mi> <mrow> <mi>q</mi> <mo>,</mo> <msub> <mi>I</mi> <mrow> <mi>q</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>></mo> <msub> <mi>th</mi> <mn>3</mn> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>q</mi> </msub> <mo>&Element;</mo> <msub> <mi>C</mi> <mi>q</mi> </msub> </mrow> </munder> <msub> <mi>C</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> <mo>&cup;</mo> <mrow> <mo>(</mo> <munder> <mrow> <mi></mi> <mo>&cup;</mo> </mrow> <mrow> <msub> <mi>p</mi> <mrow> <mi>q</mi> <mo>,</mo> <msub> <mi>I</mi> <mrow> <mi>q</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> </msub> <mo>></mo> <msub> <mi>th</mi> <mn>3</mn> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>q</mi> </msub> <mo>&Element;</mo> <msub> <mi>C</mi> <mi>q</mi> </msub> </mrow> </munder> <msub> <mi>C</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> </mrow>

C5、用C₁'、C₂'…C_i'…代替C₁、C₂…C_i…，并将C₁'、C₂'…C_i'…将命名为C₁、C₂…C_i…；

C6、重复步骤C3-C5，直到矩阵P的最大值p_max小于阈值th₃，得到最后更新单标签聚类结果C₁、C₂…C_i…；

D、根据最初概率矩阵P₀和索引矩阵I₀，将C₁、C₂…C_i…进行处理，实现鞋底花纹图像的多标签聚类；

D1、更新概率矩阵和索引矩阵；根据最初概率矩阵P₀和索引矩阵I₀，按照从大到小的顺序重新排列各个类别中所有鞋底花纹图像潜在语义主题的可能性，得到新的概率矩阵CP和索引矩阵CI；

D2、找到各个类别的代表潜在语义主题z^*及其概率p(z^*|C)；类别的代表潜在语义主题为该类别排名前th₄个中出现次数最多的主题，其概率是所有类别成员属于该主题概率的平均值，即：

<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>*</mo> <mo>|</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>N</mi> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <mi>d</mi> <mo>&Element;</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> </mrow> </munder> <mi>p</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>|</mo> <mi>d</mi> <mo>)</mo> </mrow> </mrow>

式中，N为z^*在C_i出现的次数；

D3、处理具有相同代表潜在语义主题的类别；找到具有相同代表潜在语义主题的类别，并将这些类别按照代表潜在语义主题的概率由大到小进行排序，将排序后的类别两两依次按如下方式进行处理；假定R₁、R₂、R₃是具有相同代表潜在语义主题z^*的类别排序后的结果，p₁、p₂、p₃是z^*对应于各个类别的概率；首先比较p₁和p₂，如果p₁和p₂都大于th₅并且p₁-p₂＜th₆，将两个类别合并，并保留成员个数较少的类别，即：

R₁＝R₁∪R₂

p₁-p₃＜th₆

则：

R₁＝R₁∪R₃

p₂-p₃＜th₆

则：

R₂＝R₂∪R₃

R₃更新为原R₂或R₃中成员个数较少的一个，依此类推，将代表潜在语义主题为z^*的各类别中各个成员重新标记完；

2.根据权利要求1所述的一种鞋底花纹图像的多标签聚类方法，其特征在于：步骤A1中所述的类别包括波型、折型、格型、块型、圆型、圆环型、椭圆型、类圆型、交织型、线型、图画型、角型、三角型、文字型和散杂型。