CN107301426A - 一种鞋底花纹图像的多标签聚类方法 - Google Patents

一种鞋底花纹图像的多标签聚类方法 Download PDF

Info

Publication number
CN107301426A
CN107301426A CN201710446061.4A CN201710446061A CN107301426A CN 107301426 A CN107301426 A CN 107301426A CN 201710446061 A CN201710446061 A CN 201710446061A CN 107301426 A CN107301426 A CN 107301426A
Authority
CN
China
Prior art keywords
msub
mrow
image
shoe sole
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710446061.4A
Other languages
English (en)
Other versions
CN107301426B (zh
Inventor
王新年
朱悦
王加丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN201710446061.4A priority Critical patent/CN107301426B/zh
Publication of CN107301426A publication Critical patent/CN107301426A/zh
Application granted granted Critical
Publication of CN107301426B publication Critical patent/CN107301426B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • G06V10/422Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation for representing the structure of the pattern or shape of an object therefor
    • G06V10/424Syntactic representation, e.g. by using alphabets or grammars

Abstract

本发明公开了一种鞋底花纹图像的多标签聚类方法,包括以下步骤:选取鞋底花纹图像库中各个图像的基元图像,并计算基元图像的特征选取代表图,统计得到鞋印图像库的语义词汇表;根据语义词汇表,运用PLSA模型计算鞋底花纹图像‑潜在语义主题之间的概率矩阵,去除重复的主题得到最终的概率矩阵;根据不同鞋底花纹图像属于相同潜在语义主题可能性的大小,对鞋印图像库进行单标签聚类;根据最初概率矩阵和索引矩阵,实现鞋底花纹图像的多标签聚类。本发明将鞋印图像划分为基元图像进行处理,并且考虑鞋底花纹图像之间关联性的同时也考虑了类别间的关联性,是鞋底花纹图像多标签分类的基础,可以在一定程度上提高鞋底花纹图像识别和检索的正确率。

Description

一种鞋底花纹图像的多标签聚类方法
技术领域
本发明属于数据处理技术领域,具体涉及一种鞋底花纹图像的多标签聚类方法。
背景技术
目前多标签聚类多用在文本数据集中,主要由以下两种:
1、基于模糊的多标签文本聚类方法,主要思路为:利用Wordnet选取上义词扩充核心单词,通过大量参数及阈值的设定构建候选簇,分析候选簇与其成员相似度,最后完成多标签分类。参考文献见Chen C L,Frank S C,Tseng B,Tyne L.An integration ofWordNet and fuzzy association rule mining for multi-label documentclustering.Data&Knowledge Engineering.2010,60:1208-1226。
2、基于词汇链的多标签文本聚类方法,该方法的主要思路是:结合WordNet的方法构造词汇链特征空间,并利用词汇链之间的语义相似度构造数据集的聚类图模型,实现文本数据的多标签划分。参考文献见Deodhare D,Sharma G,Srivastava A etal.Semantically driven soft-clustering of documents using lexicalchains.International Conference onNatural Language Processing.2010。
对于相似度较高的鞋底花纹图像,一个鞋印图像很难确切地分辨处于属于哪一类,同时由于磨损、残缺现象的存在,一个鞋印图像的多标签现象必然存在。目前还没有鞋底花纹图像多标签聚类方法报道。由于目前文本数据的多标签聚类方法过分依赖于文本中已知的信息,不适用于鞋底花纹图像,若将其直接应用于鞋底花纹图像多标签聚类,聚类效果不好。
发明内容
为解决现有技术存在的上述问题,本发明要设计一种适用于鞋底花纹且聚类效果好的鞋底花纹图像的多标签聚类方法。
为了实现上述目的,本发明的技术方案如下:一种鞋底花纹图像的多标签聚类方法,包括以下步骤:
A、选取鞋底花纹图像库中各个图像的基元图像,并计算基元图像的特征选取代表图,统计得到鞋印图像库的语义词汇表Ln×c
A1、根据鞋底花纹制作工艺,预先定义鞋底花纹基元的类别及其代表图像,并自动提取代表代表图像的小波-傅里叶梅林变换特征。
A2、根据鞋底花纹图像的连通特性,将鞋底花纹图像划分为不同区域。选取面积即像素点个数大于阈值th1的连通区域,取其外接矩形作为目标区域,即基元图像。
A3、对于每幅鞋底花纹图像的基元图像,提取小波-傅里叶梅林变换特征,并与不同语义类别中的代表图像做比较,然后根据比较结果将基元图像划分到不同的语义类别中。
A4、汇集所有语义类别合成语义词汇表Ln×c,其中,n为鞋印图像库图像总个数,c为基元图像的个数。
B、根据语义词汇表Ln×c,运用PLSA模型计算鞋底花纹图像-潜在语义主题之间的概率矩阵,去除重复的主题得到最终的概率矩阵P(z|d)。
B1、设定不同的潜在语义主题个数,对语义词汇表Ln×c运用PLSA模型并利用EM算法进行模型优化和拟合,得到鞋底花纹图像-潜在语义主题之间的联合概率矩阵。其中,将每幅鞋底花纹图像看作一个单独的文档,用d来表示,而视觉词汇即基元图像就看作文档中的词汇,潜在语义主题用z表示。
B2、确定重复主题。所有鞋底花纹图像在两个不同潜在语义主题上的概率分布差别小于阈值th2,这两个潜在语义主题就被称为重复主题,即|zi-zj|<th2,其中zi、zj为所有鞋底花纹图像在两个不同潜在语义主题zi、zj上的概率分布。
B3、去除重复主题。将每幅鞋底花纹图像属于重复主题概率的平均值作为该鞋底花纹图像属于新主题的概率,得到最终的概率矩阵P(z|d)。
C、根据不同鞋底花纹图像属于相同潜在语义主题可能性的大小,对鞋印图像库进行单标签聚类。
C1、将概率矩阵P(z|d)按照同一鞋底花纹图像属于各个潜在语义主题的可能性从大到小排序,得到矩阵P0和矩阵I0,其中,P0的每列是鞋底花纹图像属于各个潜在语义主题可能性从大到小的排序,pi,k是指第i幅鞋底花纹图像di概率排名第k的潜在语义主题的概率;I0是对应潜在语义主题的索引,Ii,k是指第i幅鞋底花纹图像di概率排名第k的潜在语义主题的索引。
C2、以每幅鞋底花纹图像作为处理对象,将潜在语义主题排名前两名中有相同主题,并且属于该主题的概率大于阈值th3的所有鞋底花纹图像聚为一类,将没有处理的鞋底花纹图像每幅图像看作一个类别,得到聚类结果C1、C2…Ci…,即:
C3、更新概率矩阵和索引矩阵。去除每幅鞋底花纹图像排名前两名的潜在语义主题的概率和索引,得到新的概率矩阵P和索引矩阵I。
C4、以每个类别作为处理对象,将潜在语义主题排名前两名中有相同主题,并且属于该主题的概率大于阈值th3的所有类别聚为一类,仍然将没有处理的鞋底花纹图像每幅图像看作一个类别,更新聚类结果C1'、C2'…Ci'…,即:
C5、用C1'、C2'…Ci'…代替C1、C2…Ci…,并将C1'、C2'…Ci'…将命名为C1、C2…Ci…。
C6、重复步骤C3-C5,直到矩阵P的最大值pmax小于阈值th3,得到最后更新单标签聚类结果C1、C2…Ci…。
D、根据最初概率矩阵P0和索引矩阵I0,将C1、C2…Ci…进行处理,实现鞋底花纹图像的多标签聚类。
D1、更新概率矩阵和索引矩阵。根据最初概率矩阵P0和索引矩阵I0,按照从大到小的顺序重新排列各个类别中所有鞋底花纹图像潜在语义主题的可能性,得到新的概率矩阵CP和索引矩阵CI。
D2、找到各个类别的代表潜在语义主题z*及其概率p(z*|C)。类别的代表潜在语义主题为该类别排名前th4个中出现次数最多的主题,其概率是所有类别成员属于该主题概率的平均值,即:
式中,N为z*在Ci出现的次数。
D3、处理具有相同代表潜在语义主题的类别。找到具有相同代表潜在语义主题的类别,并将这些类别按照代表潜在语义主题的概率由大到小进行排序,将排序后的类别两两依次按如下方式进行处理。假定R1、R2、R3是具有相同代表潜在语义主题z*的类别排序后的结果,p1、p2、p3是z*对应于各个类别的概率。首先比较p1和p2,如果p1和p2都大于th5并且p1-p2<th6,将两个类别合并,并保留成员个数较少的类别,即:
R1=R1∪R2
R2更新为原R1或R2中成员个数较少的一个;然后比较p1和p3,如果p1和p3都大于th5并且:
p1-p3<th6
则:
R1=R1∪R3
R3更新为原R1或R3中成员个数较少的一个;最后比较p2和p3,如果p2和p3都大于th5并且:
p2-p3<th6
则:
R2=R2∪R3
R3更新为原R2或R3中成员个数较少的一个,依此类推,将代表潜在语义主题为z*的各类别中各个成员重新标记完。
D4、对所有具有相同代表潜在语义主题的类别进行步骤D3操作,得到鞋印图像库多标签聚类结果D1、D2…Di…。
进一步地,步骤A1中所述的类别包括波型、折型、格型、块型、圆型、圆环型、椭圆型、类圆型、交织型、线型、图画型、角型、三角型、文字型和散杂型。
与现有技术相比,本发明具有以下有益效果:
1、本发明将鞋印图像划分为基元图像进行处理,并且考虑鞋底花纹图像之间关联性的同时也考虑了类别间的关联性,是鞋底花纹图像多标签分类的基础,同时可以在一定程度上提高鞋底花纹图像识别和检索的正确率。
2、本发明首次提出鞋底花纹图像多标签聚类方法,解决了以往单标签聚类的硬划分问题,更符合人的认知。
附图说明
图1是本发明的流程示意图。
具体实施方式
下面结合附图对本发明进行进一步地描述。本发明的流程如图1所示,以下对方法中用到的阈值解释如下:
阈值th1是为了区分基元图像与噪声图像,取值范围在200到400之间;阈值th2用来判定同类潜在语义主题,减少计算量,取值范围在0.1左右;阈值th3判断图像是否为一类,取值0.75~0.85;阈值th4用于确定类别的代表主题,取值范围为100~200;阈值th5和阈值th6确定类别间的关系,阈值th5取值范围为0.5~0.6,阈值th6取值为0.1。
方法中用到的PLSA模型的全称为概率潜语义分析模型,EM算法的全称为最大期望算法。
本发明不局限于本实施例,任何在本发明披露的技术范围内的等同构思或者改变,均列为本发明的保护范围。

Claims (2)

1.一种鞋底花纹图像的多标签聚类方法,其特征在于:包括以下步骤:
A、选取鞋底花纹图像库中各个图像的基元图像,并计算基元图像的特征选取代表图,统计得到鞋印图像库的语义词汇表Ln×c
A1、根据鞋底花纹制作工艺,预先定义鞋底花纹基元的类别及其代表图像,并自动提取代表代表图像的小波-傅里叶梅林变换特征;
A2、根据鞋底花纹图像的连通特性,将鞋底花纹图像划分为不同区域;选取面积即像素点个数大于阈值th1的连通区域,取其外接矩形作为目标区域,即基元图像;
A3、对于每幅鞋底花纹图像的基元图像,提取小波-傅里叶梅林变换特征,并与不同语义类别中的代表图像做比较,然后根据比较结果将基元图像划分到不同的语义类别中;
A4、汇集所有语义类别合成语义词汇表Ln×c,其中,n为鞋印图像库图像总个数,c为基元图像的个数;
B、根据语义词汇表Ln×c,运用PLSA模型计算鞋底花纹图像-潜在语义主题之间的概率矩阵,去除重复的主题得到最终的概率矩阵P(z|d);
B1、设定不同的潜在语义主题个数,对语义词汇表Ln×c运用PLSA模型并利用EM算法进行模型优化和拟合,得到鞋底花纹图像-潜在语义主题之间的联合概率矩阵;其中,将每幅鞋底花纹图像看作一个单独的文档,用d来表示,而视觉词汇即基元图像就看作文档中的词汇,潜在语义主题用z表示;
B2、确定重复主题;所有鞋底花纹图像在两个不同潜在语义主题上的概率分布差别小于阈值th2,这两个潜在语义主题就被称为重复主题,即|zi-zj|<th2,其中zi、zj为所有鞋底花纹图像在两个不同潜在语义主题zi、zj上的概率分布;
B3、去除重复主题;将每幅鞋底花纹图像属于重复主题概率的平均值作为该鞋底花纹图像属于新主题的概率,得到最终的概率矩阵P(z|d);
C、根据不同鞋底花纹图像属于相同潜在语义主题可能性的大小,对鞋印图像库进行单标签聚类;
C1、将概率矩阵P(z|d)按照同一鞋底花纹图像属于各个潜在语义主题的可能性从大到小排序,得到矩阵P0和矩阵I0,其中,P0的每列是鞋底花纹图像属于各个潜在语义主题可能性从大到小的排序,pi,k是指第i幅鞋底花纹图像di概率排名第k的潜在语义主题的概率;I0是对应潜在语义主题的索引,Ii,k是指第i幅鞋底花纹图像di概率排名第k的潜在语义主题的索引;
C2、以每幅鞋底花纹图像作为处理对象,将潜在语义主题排名前两名中有相同主题,并且属于该主题的概率大于阈值th3的所有鞋底花纹图像聚为一类,将没有处理的鞋底花纹图像每幅图像看作一个类别,得到聚类结果C1、C2…Ci…,即:
<mrow> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>=</mo> <mrow> <mo>(</mo> <munder> <mrow> <mi></mi> <mo>&amp;cup;</mo> </mrow> <mrow> <msub> <mi>p</mi> <mrow> <mi>q</mi> <mo>,</mo> <msub> <mi>I</mi> <mrow> <mi>q</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>&gt;</mo> <msub> <mi>th</mi> <mn>3</mn> </msub> </mrow> </munder> <msub> <mi>d</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> <mo>&amp;cup;</mo> <mrow> <mo>(</mo> <munder> <mrow> <mi></mi> <mo>&amp;cup;</mo> </mrow> <mrow> <msub> <mi>p</mi> <mrow> <mi>q</mi> <mo>,</mo> <msub> <mi>I</mi> <mrow> <mi>q</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> </msub> <mo>&gt;</mo> <msub> <mi>th</mi> <mn>3</mn> </msub> </mrow> </munder> <msub> <mi>d</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> </mrow>
C3、更新概率矩阵和索引矩阵;去除每幅鞋底花纹图像排名前两名的潜在语义主题的概率和索引,得到新的概率矩阵P和索引矩阵I;
C4、以每个类别作为处理对象,将潜在语义主题排名前两名中有相同主题,并且属于该主题的概率大于阈值th3的所有类别聚为一类,仍然将没有处理的鞋底花纹图像每幅图像看作一个类别,更新聚类结果C1'、C2'…Ci'…,即:
<mrow> <msup> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>&amp;prime;</mo> </msup> <mo>=</mo> <mrow> <mo>(</mo> <munder> <mrow> <mi></mi> <mo>&amp;cup;</mo> </mrow> <mrow> <msub> <mi>p</mi> <mrow> <mi>q</mi> <mo>,</mo> <msub> <mi>I</mi> <mrow> <mi>q</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> </mrow> </msub> <mo>&gt;</mo> <msub> <mi>th</mi> <mn>3</mn> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>q</mi> </msub> <mo>&amp;Element;</mo> <msub> <mi>C</mi> <mi>q</mi> </msub> </mrow> </munder> <msub> <mi>C</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> <mo>&amp;cup;</mo> <mrow> <mo>(</mo> <munder> <mrow> <mi></mi> <mo>&amp;cup;</mo> </mrow> <mrow> <msub> <mi>p</mi> <mrow> <mi>q</mi> <mo>,</mo> <msub> <mi>I</mi> <mrow> <mi>q</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> </msub> <mo>&gt;</mo> <msub> <mi>th</mi> <mn>3</mn> </msub> <mo>,</mo> <msub> <mi>d</mi> <mi>q</mi> </msub> <mo>&amp;Element;</mo> <msub> <mi>C</mi> <mi>q</mi> </msub> </mrow> </munder> <msub> <mi>C</mi> <mi>q</mi> </msub> <mo>)</mo> </mrow> </mrow>
C5、用C1'、C2'…Ci'…代替C1、C2…Ci…,并将C1'、C2'…Ci'…将命名为C1、C2…Ci…;
C6、重复步骤C3-C5,直到矩阵P的最大值pmax小于阈值th3,得到最后更新单标签聚类结果C1、C2…Ci…;
D、根据最初概率矩阵P0和索引矩阵I0,将C1、C2…Ci…进行处理,实现鞋底花纹图像的多标签聚类;
D1、更新概率矩阵和索引矩阵;根据最初概率矩阵P0和索引矩阵I0,按照从大到小的顺序重新排列各个类别中所有鞋底花纹图像潜在语义主题的可能性,得到新的概率矩阵CP和索引矩阵CI;
D2、找到各个类别的代表潜在语义主题z*及其概率p(z*|C);类别的代表潜在语义主题为该类别排名前th4个中出现次数最多的主题,其概率是所有类别成员属于该主题概率的平均值,即:
<mrow> <mi>p</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>*</mo> <mo>|</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mi>N</mi> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>d</mi> <mo>&amp;Element;</mo> <msub> <mi>C</mi> <mi>i</mi> </msub> </mrow> </munder> <mi>p</mi> <mrow> <mo>(</mo> <mi>z</mi> <mo>|</mo> <mi>d</mi> <mo>)</mo> </mrow> </mrow>
式中,N为z*在Ci出现的次数;
D3、处理具有相同代表潜在语义主题的类别;找到具有相同代表潜在语义主题的类别,并将这些类别按照代表潜在语义主题的概率由大到小进行排序,将排序后的类别两两依次按如下方式进行处理;假定R1、R2、R3是具有相同代表潜在语义主题z*的类别排序后的结果,p1、p2、p3是z*对应于各个类别的概率;首先比较p1和p2,如果p1和p2都大于th5并且p1-p2<th6,将两个类别合并,并保留成员个数较少的类别,即:
R1=R1∪R2
<mrow> <msub> <mi>p</mi> <mn>1</mn> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>p</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>p</mi> <mn>2</mn> </msub> </mrow> <mn>2</mn> </mfrac> </mrow>
R2更新为原R1或R2中成员个数较少的一个;然后比较p1和p3,如果p1和p3都大于th5并且:
p1-p3<th6
则:
R1=R1∪R3
<mrow> <msub> <mi>p</mi> <mn>1</mn> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>p</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>p</mi> <mn>3</mn> </msub> </mrow> <mn>2</mn> </mfrac> </mrow>
R3更新为原R1或R3中成员个数较少的一个;最后比较p2和p3,如果p2和p3都大于th5并且:
p2-p3<th6
则:
R2=R2∪R3
<mrow> <msub> <mi>p</mi> <mn>2</mn> </msub> <mo>=</mo> <mfrac> <mrow> <msub> <mi>p</mi> <mn>2</mn> </msub> <mo>+</mo> <msub> <mi>p</mi> <mn>3</mn> </msub> </mrow> <mn>2</mn> </mfrac> </mrow>
R3更新为原R2或R3中成员个数较少的一个,依此类推,将代表潜在语义主题为z*的各类别中各个成员重新标记完;
D4、对所有具有相同代表潜在语义主题的类别进行步骤D3操作,得到鞋印图像库多标签聚类结果D1、D2…Di…。
2.根据权利要求1所述的一种鞋底花纹图像的多标签聚类方法,其特征在于:步骤A1中所述的类别包括波型、折型、格型、块型、圆型、圆环型、椭圆型、类圆型、交织型、线型、图画型、角型、三角型、文字型和散杂型。
CN201710446061.4A 2017-06-14 2017-06-14 一种鞋底花纹图像的多标签聚类方法 Active CN107301426B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710446061.4A CN107301426B (zh) 2017-06-14 2017-06-14 一种鞋底花纹图像的多标签聚类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710446061.4A CN107301426B (zh) 2017-06-14 2017-06-14 一种鞋底花纹图像的多标签聚类方法

Publications (2)

Publication Number Publication Date
CN107301426A true CN107301426A (zh) 2017-10-27
CN107301426B CN107301426B (zh) 2020-06-30

Family

ID=60134777

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710446061.4A Active CN107301426B (zh) 2017-06-14 2017-06-14 一种鞋底花纹图像的多标签聚类方法

Country Status (1)

Country Link
CN (1) CN107301426B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860500A (zh) * 2020-07-10 2020-10-30 大连海事大学 一种鞋印磨损区域检测与描边方法
CN112766427A (zh) * 2021-04-06 2021-05-07 浙江口碑网络技术有限公司 图像识别模型的训练方法、装置及设备
CN113537391A (zh) * 2021-08-06 2021-10-22 大连海事大学 一种交互式文本语义属性引导的鞋印图像聚类方法
CN117493574A (zh) * 2024-01-02 2024-02-02 北京华顺信安信息技术有限公司 词汇标签的确定方法及系统和查询语句的生成方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
TW201118754A (en) * 2009-11-17 2011-06-01 Nat Cheng Kong University Face clustering system using PLSA model
CN102629328A (zh) * 2012-03-12 2012-08-08 北京工业大学 融合颜色的显著特征概率潜在语义模型物体图像识别方法
CN104899596A (zh) * 2015-03-16 2015-09-09 景德镇陶瓷学院 一种多标签分类方法及其装置
CN105069136A (zh) * 2015-08-18 2015-11-18 成都鼎智汇科技有限公司 一种大数据环境下的图像识别方法
CN106777050A (zh) * 2016-12-09 2017-05-31 大连海事大学 一种基于词袋模型且兼顾语义相关性的鞋印花纹表达方法及系统
CN106776571A (zh) * 2016-12-27 2017-05-31 北京奇虎科技有限公司 一种标签的生成方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101315663A (zh) * 2008-06-25 2008-12-03 中国人民解放军国防科学技术大学 一种基于区域潜在语义特征的自然场景图像分类方法
TW201118754A (en) * 2009-11-17 2011-06-01 Nat Cheng Kong University Face clustering system using PLSA model
CN102629328A (zh) * 2012-03-12 2012-08-08 北京工业大学 融合颜色的显著特征概率潜在语义模型物体图像识别方法
CN104899596A (zh) * 2015-03-16 2015-09-09 景德镇陶瓷学院 一种多标签分类方法及其装置
CN105069136A (zh) * 2015-08-18 2015-11-18 成都鼎智汇科技有限公司 一种大数据环境下的图像识别方法
CN106777050A (zh) * 2016-12-09 2017-05-31 大连海事大学 一种基于词袋模型且兼顾语义相关性的鞋印花纹表达方法及系统
CN106776571A (zh) * 2016-12-27 2017-05-31 北京奇虎科技有限公司 一种标签的生成方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
RUI ZHAO 等: "Supervised Adaptive-transfer PLSA for Cross-Domain Text Classification", 《2014 IEEE INTERNATIONAL CONFERENCE ON DATA MINING WORKSHOP》 *
严考碧 等: "基于主题模型的多示例多标记学习方法", 《计算机应用》 *
孙会会: "基于反馈的现场鞋底痕迹花纹检索算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
王行行: "面向检索的鞋底花纹图像语义表达算法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
程思颖: "多标签聚类算法及其评价研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860500A (zh) * 2020-07-10 2020-10-30 大连海事大学 一种鞋印磨损区域检测与描边方法
CN111860500B (zh) * 2020-07-10 2024-03-19 大连海事大学 一种鞋印磨损区域检测与描边方法
CN112766427A (zh) * 2021-04-06 2021-05-07 浙江口碑网络技术有限公司 图像识别模型的训练方法、装置及设备
CN113537391A (zh) * 2021-08-06 2021-10-22 大连海事大学 一种交互式文本语义属性引导的鞋印图像聚类方法
CN113537391B (zh) * 2021-08-06 2023-09-05 大连海事大学 一种交互式文本语义属性引导的鞋印图像聚类方法
CN117493574A (zh) * 2024-01-02 2024-02-02 北京华顺信安信息技术有限公司 词汇标签的确定方法及系统和查询语句的生成方法及系统

Also Published As

Publication number Publication date
CN107301426B (zh) 2020-06-30

Similar Documents

Publication Publication Date Title
Kadhim et al. Text document preprocessing and dimension reduction techniques for text document clustering
CN102902821B (zh) 基于网络热点话题的图像高级语义标注、检索方法及装置
CN104137097B (zh) 谓语模板收集装置以及特定短语对收集装置
CN102819836B (zh) 一种图像分割方法及系统
CN104035975B (zh) 一种利用中文在线资源实现远程监督人物关系抽取的方法
CN107301426A (zh) 一种鞋底花纹图像的多标签聚类方法
US10019492B2 (en) Stop word identification method and apparatus
CN105389326B (zh) 基于弱匹配概率典型相关性模型的图像标注方法
CN108647322B (zh) 基于词网识别大量Web文本信息相似度的方法
CN101561805A (zh) 文档分类器生成方法和系统
CN110889282B (zh) 一种基于深度学习的文本情感分析方法
CN107436955B (zh) 一种基于Wikipedia概念向量的英文词语相关度计算方法和装置
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN105718532A (zh) 一种基于多深度网络结构的跨媒体排序方法
CN107169043A (zh) 一种基于标准答案的知识点自动提取方法及系统
CN105631749A (zh) 基于统计数据的用户画像计算方法
Saleh et al. A semantic based Web page classification strategy using multi-layered domain ontology
CN103778206A (zh) 一种网络服务资源的提供方法
CN112699232A (zh) 文本标签提取方法、装置、设备和存储介质
CN111353045A (zh) 构建文本分类体系的方法
Bedau et al. Open-ended technological innovation
Neshati et al. Integration of scientific and social networks
Ravindran et al. K-means document clustering using vector space model
CN108519978A (zh) 一种基于主动学习的中文正式文本分词方法
CN102693258A (zh) 高精度的类似检索系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant