CN107832772A - 一种基于半监督字典学习的图像识别方法及装置 - Google Patents
一种基于半监督字典学习的图像识别方法及装置 Download PDFInfo
- Publication number
- CN107832772A CN107832772A CN201710854155.5A CN201710854155A CN107832772A CN 107832772 A CN107832772 A CN 107832772A CN 201710854155 A CN201710854155 A CN 201710854155A CN 107832772 A CN107832772 A CN 107832772A
- Authority
- CN
- China
- Prior art keywords
- dictionary
- image
- training image
- label training
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明适用计算机技术领域,提供了一种基于半监督字典学习的图像识别方法及装置,该方法包括:接收输入的待识别图像,获取待识别图像的特征向量;根据特征向量获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,各个子图像字典与不同类别的图像采集对象相对应;根据编码系数计算待识别图像在各个子图像字典上的重构误差,获取重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为待识别图像对应的识别对象,从而使得待识别图像在预先构建的半监督图像字典对应的子图像字典上取得最小的重构误差,提高了待识别图像的识别能力。
Description
技术领域
本发明属于计算机技术领域,尤其涉及一种基于半监督字典学习的图像识别方法及装置。
背景技术
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术,目前已被广泛地应用到各个领域,以实现用户认证或安全监控等功能。人脸识别的精确度决定了人脸识别的应用前景,因此,涉及人脸识别领域的公司和科研机构都投入了大量的人力物力来不断提高人脸识别的精确度。
近几年来,基于稀疏表示的人脸识别技术在提高人脸识别效果方面取得了较好的成效。稀疏表示将构成人脸图像的所有像素值按列排列,构成该人脸图像的特征向量,另外,稀疏表示认为每个人的人脸图像都位于各自的线性子空间内,任何一个待识别的人脸图像的特征向量可以由该人的其它人脸图像的特征向量进行线性表示,因此,为了能够对特征向量进行较好的线性表示,对于每一个人,只有在数据库中应拥有足够多的样本,才能构成足够大的线性子空间。然而,在实际应用中,由于给样本进行标注需要耗费大量的时间和人力,因此,在现实生活中通常会有大量的未标注样本。
半监督字典学习就是利用了未进行标注的人脸图像样本,以提高人脸识别的识别效果。然而,现有的半监督字典学习忽视了无标签样本所包含的鉴别信息,不能有效利用无标签样本,使得基于半监督字典学习的人脸识别软件或算法的识别效果仍然不是很好。
发明内容
本发明的目的在于提供一种基于半监督字典学习的图像识别方法及系统,旨在解决由于现有技术无法有效利用未标注图像样本,使得图像识别的识别效果不佳的问题。
一方面,本发明提供了一种基于半监督字典学习的图像识别方法,所述方法包括下述步骤:
接收输入的待识别图像,获取所述待识别图像的特征向量;
根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,所述各个子图像字典与不同类别的图像采集对象相对应;
根据所述编码系数计算所述待识别图像在所述各个子图像字典上的重构误差,获取所述重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为所述待识别图像对应的识别对象。
另一方面,本发明提供了一种基于半监督字典学习的图像识别装置,所述装置包括:
向量获取单元,用于接收输入的待识别图像,获取所述待识别图像的特征向量;
系数获取单元,用于根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,所述各个子图像字典与不同类别的图像采集对象相对应;以及
对象确定单元,用于根据所述编码系数计算所述待识别图像在所述各个子图像字典上的重构误差,获取所述重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为所述待识别图像对应的识别对象。
本发明在接收输入的待识别图像后,获取待识别图像的特征向量,根据特征向量获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,根据编码系数计算待识别图像在各个子图像字典上的重构误差,获取重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为待识别图像对应的识别对象,从而使得待识别图像在预先构建的半监督图像字典对应的子图像字典上取得最小的重构误差,提高了待识别图像的识别能力。
附图说明
图1是本发明实施例一提供的基于半监督字典学习的图像识别方法的实现流程图;
图2是本发明实施例二提供的基于半监督字典学习的图像识别装置的结构示意图;以及
图3是本发明实施例三提供的基于半监督字典学习的图像识别装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的基于半监督字典学习的图像识别方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,接收输入的待识别图像,获取待识别图像的特征向量。
本发明实施例适用于图像识别系统或平台,以在输入待识别图像时得到待识别图像涉及的拍摄或采集对象。当接收输入的待识别图像后,首先提取待识别图像的初始特征向量,对初始特征向量进行降维,从而得到待识别图像的特征向量。作为示例地,可采用主成分分析(PCA)算法对初始特征向量进行降维处理。
在步骤S102中,根据待识别图像的特征向量获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数。
在本发明实施例,在获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数时,使用函数获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数y,即取最小值时对应的编码系数y,其中,a表示待识别图像,F表示F范数,γ为一常数,表示预先构建的半监督图像字典。优选地,通过下述步骤构建半监督图像字典
(1)获取输入的带标签训练图像和无标签训练图像的特征向量,根据带标签训练图像和无标签训练图像的特征向量,生成表示所有带标签训练图像的第一矩阵以及表示所有无标签训练图像的第二矩阵。
在本发明实施例中,带标签训练图像具有图像标签,例如,图像涉及的人或物(名称)或图像的类型等,而无标签训练图像则没有图像标签。在获取输入的带标签训练图像和无标签训练图像的特征向量时,首先提取待识别图像的初始特征向量,之后采用PCA之类的降维算法对初始特征向量进行降维,从而得到带标签训练图像和无标签训练图像的特征向量。
为了构建图像字典进一步根据带标签训练图像和无标签训练图像的特征向量,生成表示所有带标签训练图像的第一矩阵以及表示所有无标签训练图像的第二矩阵,第一矩阵可以表示为A=[A1,…,Ai,…,AC],Ai表示第i个图像采集对象对应的所有带标签训练图像的特征向量构成的矩阵,C表示带标签训练图像采集对象的总类别数量,这里的类别是指同一带标签训练图像采集对象为一个类别,而第二矩阵可以表示为B=[b1,…,bj,…,bN],bj表示第j个无标签训练图像对应的特征向量,N为无标签训练图像的总数。
(2)构造一个n*C的概率矩阵,并对概率矩阵进行初始化,其中,n为带标签训练图像和无标签训练图像的总数量。
在本发明实施例中,n为带标签训练图像和无标签训练图像的总数目,概率矩阵中的矩阵元素(m,k)表示的是第m个训练图像(可能为带标签训练图像或者无标签训练图像)属于第k个图像采集对象的概率(m≤n,k≤C),初始化时,将无标签训练图像属于各个对象的概率都置零,带标签训练图像在对应对象上的概率为1,在其余对象上的概率为零。
(3)对第一矩阵的每一列进行归一化操作,使得每一列的2范数为1,以得到与图像采集对象对应的初始图像字典,并对预设的扩展字典、带标签训练图像和无标签训练图像的编码系数进行初始化。
在本发明实施例中,初始图像字典可以用D表示,预设的扩展字典可以用E表示,在初始化时可以将E初始化为空矩阵,用带标签训练图像初始化图像字典D。
(4)使用公式计算第二矩阵中每一列在初始图像字典中的各个初始子图像字典的重构误差通过公式更新概率矩阵在第j个图像采集对象上的概率,其中,bj表示第j个无标签训练图像的特征矩阵,Di表示初始图像字典中的第i个初始子图像字典,Ei表示第i个扩展字典,表示第j个无标签训练图像在第i个子字典[Di,Ei]上的编码系数,β为一常数。
(5)通过增加每一个初始子图像字典的字典原子个数对初始图像字典进行扩展,扩展后初始图像字典表示为根据扩展后初始图像字典使用公式Ei=U(:,n)对扩展字典进行更新,其中,U通过计算得到,svd表示奇异值分解, 表示带标签训练图像Ai在第i类子字典的编码系数,
在本发明实施例中,因为更新了概率矩阵之后,有更多的无标签训练图像被加入到图像字典训练中,此时原有的初始图像字典D的大小将不能够很好的表示训练样本,因此增加每一个采集图像对象的字典原子个数,增加字典原子个数之后的扩展后初始图像字典为其中,Ei可通过公式获得,其中,svd表示奇异值分解,这样Ei可表示为Ei=U(:,n)。
(6)使用函数更新带标签数据训练图像的编码系数,根据无标签训练图像的图像类型,使用预设的函数更新无标签训练图像的编码系数,其中,Mi为第i类标签训练数据的均值系数矩阵。
在本发明实施例中,在初始图像字典被扩展后,对带标签数据训练图像和无标签训练图像的编码系数进行更新,以便更准确地表示带标签数据训练图像和无标签训练图像。具体地,使用函数更新带标签数据训练图像的编码系数,即用取得最小值的编码系数更新无标签训练图像之前的编码系数。在更新无标签训练图像的编码系数时,可根据标签训练图像的数量,使用预设的函数更新无标签训练图像的编码系数,以便对无标签训练图像的编码系数进行更为精确的描述。具体地,当每一类标签训练图像数量少于预设阈值时,通过函数更新无标签训练图像的编码系数,即以取得最小值的yj更新第j个无标签训练图像的编码系数,当每一类的标签训练图像数量大于等于预设阈值时,通过函数更新无标签训练图像的编码系数,从而根据标签训练图像的数量多少对无标签训练图像的编码系数进行差异化更新,提高了无标签训练图像的编码系数的更新准确性。
(7)根据带标签数据训练图像的编码系数和无标签训练图像的编码系数,使用函数更新扩展后初始图像字典将更新后的扩展后初始图像字典确定为半监督图像字典。
在本发明实施例中,在得到带标签数据训练图像和无标签训练图像的更新后编码系数后,根据函数确定Di和Ei,进而得到从而实现对扩展后初始图像字典的更新,最后将更新后的扩展后初始图像字典确定为半监督图像字典,更新后的图像字典具有更好的表示能力和图像鉴别能力。
在步骤S103中,根据编码系数计算待识别图像在各个子图像字典上的重构误差,获取重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为待识别图像对应的识别对象。
在本发明实施例中,通过步骤S102获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数后,获取重构误差为最小值时对应的图像采集对象,此时表明重构误差最小对应的半监督图像字典中的子图像字典最能恰当地表示待识别图像,因此,将该图像采集对象确定为此时对应的图像采集对象确定为待识别图像对应的识别对象,从而完成待识别图像的识别。
具体地,计算待识别图像在各个子图像字典上的重构误差时,通过公式计算。
在本发明实施例中,预先构建的半监督图像字典结合了两种编码策略,使得测试样本在对应的子图像字典上得到更好的表示,具有更好图像鉴别能力,有效提高了图像的识别精度。
为了描述本发明实施例可达到的效果,发明人通过实验对现有半监督字典学习算法S2D2、JDL和USSDL以及现有监督字典学习算法SRC、M-SVM、FDDL、LC-KSVD和SVGDL与本发明实施例的图像识别精度(%)进行了比较。
为了客观公正地对这些算法的识别精度进行比较,在此次比较实验中采用标准人脸数据库Extend YaleB,该数据库中包含38个人的正脸图像,每个人64张图像,共2414张图像。比较过程中详细的参数设置如下:
a.从每个人的图像中随机挑选20张图片作为训练集,其余的44张图片作为验证集;
b.随机地从每个人的20张图像中分别抽取2、5、10张作为标签训练图像,进行3组实验,其余的作为非标签训练图像;
c.使用的图片采用主成分分析(PCA)算法进行降维处理,得到300维的特征向量。
表1示出了现有半监督字典学习算法S2D2、JDL和USSDL以及现有监督字典学习算法SRC、M-SVM、FDDL、LC-KSVD和SVGDL与本发明实施例的图像识别精度(%)比较。
表1识别精度(%)比较
从表1可以看出,本发明实施例的图像识别精度高于现有监督字典学习算法以及其他半监督字典学习算法的图像识别精度,尤其在标签训练图像较少时,比如标签训练样本只有2个的时候,识别精度更是远超过监督字典学习算法的识别精度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
实施例二:
图2示出了本发明实施例二提供的基于半监督字典学习的图像识别装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
向量获取单元21,用于接收输入的待识别图像,获取待识别图像的特征向量;
系数获取单元22,用于根据特征向量获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,该各个子图像字典与不同类别的图像采集对象相对应;以及
对象确定单元23,用于根据编码系数计算待识别图像在各个子图像字典上的重构误差,获取重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为待识别图像对应的识别对象。
在本发明实施例中,图像识别装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考前述方法实施例中对应步骤的描述,在此不再赘述。
实施例三:
图3示出了本发明实施例三提供的基于半监督字典学习的图像识别装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
矩阵生成单元301,用于获取输入的带标签训练图像和无标签训练图像的特征向量,根据带标签训练图像和无标签训练图像的特征向量,生成表示所有带标签训练图像的第一矩阵以及表示所有无标签训练图像的第二矩阵;
第一初始化单元302,用于构造一个n*C的概率矩阵,并对概率矩阵进行初始化,n为带标签训练图像和无标签训练图像的总数量,C表示带标签训练图像采集对象的总类别数量;
第二初始化单元303,用于对第一矩阵的每一列进行归一化操作,使得每一列的2范数为1,以得到与图像采集对象对应的初始图像字典,并对预设的扩展字典、带标签训练图像和无标签训练图像的编码系数进行初始化;
概率更新单元304,用于使用公式计算第二矩阵中每一列在初始图像字典中的各个初始子图像字典的重构误差通过公式更新概率矩阵在第j个图像采集对象上的概率;
扩展字典更新单元305,用于通过增加每一个初始子图像字典的字典原子个数对初始图像字典进行扩展,扩展后初始图像字典表示为根据扩展后初始图像字典使用公式Ei=U(:,n)对扩展字典进行更新,其中,U通过计算得到,svd表示奇异值分解,Ai表示第i类图像采集对象的带标签训练图像对应的特征向量;
系数更新单元306,用于使用函数更新带标签数据训练图像的编码系数,根据无标签训练图像的图像类型,使用预设的函数更新无标签训练图像的编码系数,其中,Mi为第i类标签训练数据的均值系数矩阵;
图像字典确定单元307,用于根据带标签数据训练图像的编码系数和无标签训练图像的编码系数,使用函数更新扩展后初始图像字典将更新后的扩展后初始图像字典确定为半监督图像字典;
向量获取单元308,用于接收输入的待识别图像,获取待识别图像的特征向量;
系数获取单元309,用于根据特征向量获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,各个子图像字典与不同类别的图像采集对象相对应;以及
对象确定单元310,用于根据编码系数计算待识别图像在各个子图像字典上的重构误差,获取重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为待识别图像对应的识别对象。
具体地,系数更新单元306包括:
第一更新单元3061,用于当无标签训练图像少于预设阈值时,通过函数更新无标签训练图像的编码系数;以及
第二更新单元3062,用于当无标签训练图像为大于等于预设阈值时,通过函数更新无标签训练图像的编码系数。
向量获取单元308包括:
特征提取单元3081,用于提取待识别图像的初始特征向量,对初始特征向量进行降维,以得到待识别图像的特征向量。
系数获取单元309包括:
系数获取子单元3091,用于使用函数获取待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数y,其中,a表示待识别图像,表示半监督图像字典,F表示F范数,γ为一常数。
在本发明实施例中,图像识别装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。各单元的具体实施方式可参考前述方法实施例中对应步骤的描述,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于半监督字典学习的图像识别方法,其特征在于,所述方法包括下述步骤:
接收输入的待识别图像,获取所述待识别图像的特征向量;
根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,所述各个子图像字典与不同类别的图像采集对象相对应;
根据所述编码系数计算所述待识别图像在所述各个子图像字典上的重构误差,获取所述重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为所述待识别图像对应的识别对象。
2.如权利要求1所述的方法,其特征在于,获取所述待识别图像的特征向量的步骤,包括:
提取所述待识别图像的初始特征向量,对所述初始特征向量进行降维,以得到所述待识别图像的特征向量。
3.如权利要求1所述的方法,其特征在于,所述根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数的步骤,包括:
使用函数获取所述待识别图像在所述半监督图像字典中的各个子图像字典上的编码系数y,其中,a表示所述待识别图像,表示所述半监督图像字典,F表示F范数,γ为一常数。
4.如权利要求1所述的方法,其特征在于,根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数的步骤之前,所述方法还包括:
获取输入的带标签训练图像和无标签训练图像的特征向量,根据所述带标签训练图像和无标签训练图像的特征向量,生成表示所有所述带标签训练图像的第一矩阵以及表示所有所述无标签训练图像的第二矩阵;
构造一个n*C的概率矩阵,并对所述概率矩阵进行初始化,所述n为所述带标签训练图像和无标签训练图像的总数量,C表示所述带标签训练图像采集对象的总类别数量;
对所述第一矩阵的每一列进行归一化操作,使得每一列的2范数为1,以得到与所述图像采集对象对应的初始图像字典,并对预设的扩展字典、所述带标签训练图像和无标签训练图像的编码系数进行初始化;
使用公式计算所述第二矩阵中每一列在所述初始图像字典中的各个初始子图像字典的重构误差通过公式更新所述概率矩阵在第j个所述图像采集对象上的概率,其中,bj表示第j个无标签训练图像的特征矩阵,Di表示所述初始图像字典中的第i个初始子图像字典,Ei表示第i个扩展字典,表示第j个无标签训练图像在第i个子字典[Di,Ei]上的编码系数,F表示F范数,C表示所述带标签训练图像采集对象的总类别数量,β为一常数;
通过增加每一个初始子图像字典的字典原子个数对所述初始图像字典进行扩展,所述扩展后初始图像字典表示为根据扩展后初始图像字典使用公式Ei=U(:,n)对所述扩展字典进行更新,其中,U通过计算得到,svd表示奇异值分解,Ai表示第i类图像采集对象的带标签训练图像对应的特征向量, 表示所述带标签训练图像在第i类子字典的编码系数,
使用函数更新所述带标签数据训练图像的编码系数,根据所述无标签训练图像的图像类型,使用预设的函数更新所述无标签训练图像的编码系数,其中,Mi为第i类标签训练数据的均值系数矩阵;
根据所述带标签数据训练图像的编码系数和所述无标签训练图像的编码系数,使用函数更新所述扩展后初始图像字典将更新后的所述扩展后初始图像字典确定为所述半监督图像字典。
5.如权利要求4所述的方法,其特征在于,根据所述无标签训练图像的图像类型,使用预设的函数更新所述无标签训练图像的编码系数的步骤,包括:
当每一类的标签训练图像少于预设阈值时,通过函数更新所述无标签训练图像的编码系数;
当每一类的标签训练图像大于等于所述预设阈值时,通过函数更新所述无标签训练图像的编码系数。
6.一种基于半监督字典学习的图像识别装置,其特征在于,所述装置包括:
向量获取单元,用于接收输入的待识别图像,获取所述待识别图像的特征向量;
系数获取单元,用于根据所述特征向量获取所述待识别图像在预先构建的半监督图像字典中的各个子图像字典上的编码系数,所述各个子图像字典与不同类别的图像采集对象相对应;以及
对象确定单元,用于根据所述编码系数计算所述待识别图像在所述各个子图像字典上的重构误差,获取所述重构误差为最小值时对应的图像采集对象,将该图像采集对象确定为所述待识别图像对应的识别对象。
7.如权利要求6所述的装置,其特征在于,所述向量获取单元包括:
特征提取单元,用于提取所述待识别图像的初始特征向量,对所述初始特征向量进行降维,以得到所述待识别图像的特征向量。
8.如权利要求6所述的装置,其特征在于,所述系数获取单元的步骤,包括:
系数获取子单元,用于使用函数获取所述待识别图像在所述半监督图像字典中的各个子图像字典上的编码系数y,其中,a表示所述待识别图像,表示所述半监督图像字典,F表示F范数,γ为一常数。
9.如权利要求6所述的装置,其特征在于,所述装置还包括:
矩阵生成单元,用于获取输入的带标签训练图像和无标签训练图像的特征向量,根据所述带标签训练图像和无标签训练图像的特征向量,生成表示所有所述带标签训练图像的第一矩阵以及表示所有所述无标签训练图像的第二矩阵;
第一初始化单元,用于构造一个n*C的概率矩阵,并对所述概率矩阵进行初始化,所述n为所述带标签训练图像和无标签训练图像的总数量,C表示所述带标签训练图像采集对象的总类别数量;
第二初始化单元,用于对所述第一矩阵的每一列进行归一化操作,使得每一列的2范数为1,以得到与所述图像采集对象对应的初始图像字典,并对预设的扩展字典、所述带标签训练图像和无标签训练图像的编码系数进行初始化;
概率更新单元,用于使用公式计算所述第二矩阵中每一列在所述初始图像字典中的各个初始子图像字典的重构误差通过公式更新所述概率矩阵在第j个所述图像采集对象上的概率,其中,bj表示第j个无标签训练图像的特征矩阵,Di表示所述初始图像字典中的第i个初始子图像字典,Ei表示第i个扩展字典,表示第j个无标签训练图像在第i个子字典[Di,Ei]上的编码系数,F表示F范数,C表示所述带标签训练图像采集对象的总类别数量,β为一常数;
扩展字典更新单元,用于通过增加每一个初始子图像字典的字典原子个数对所述初始图像字典进行扩展,所述扩展后初始图像字典表示为根据扩展后初始图像字典使用公式Ei=U(:,n)对所述扩展字典进行更新,其中,U通过计算得到,svd表示奇异值分解,Ai表示所述第一矩阵中第i类图像采集对象的带标签训练图像对应的特征向量, 表示所述带标签训练图像在第i类子字典的编码系数,
系数更新单元,用于使用函数更新所述带标签数据训练图像的编码系数,根据所述无标签训练图像的图像类型,使用预设的函数更新所述无标签训练图像的编码系数,其中,Mi为第i类标签训练数据的均值系数矩阵;以及
图像字典确定单元,用于根据所述带标签数据训练图像的编码系数和所述无标签训练图像的编码系数,使用函数更新所述扩展后初始图像字典将更新后的所述扩展后初始图像字典确定为所述半监督图像字典。
10.如权利要求9所述的装置,其特征在于,所述系数更新单元包括:
第一更新单元,当每一类标签训练图像少于预设阈值时,通过函数更新所述无标签训练图像的编码系数;以及
第二更新单元,当每一类标签训练图像大于等于所述预设阈值时,通过函数更新所述无标签训练图像的编码系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710854155.5A CN107832772A (zh) | 2017-09-20 | 2017-09-20 | 一种基于半监督字典学习的图像识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710854155.5A CN107832772A (zh) | 2017-09-20 | 2017-09-20 | 一种基于半监督字典学习的图像识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107832772A true CN107832772A (zh) | 2018-03-23 |
Family
ID=61643903
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710854155.5A Pending CN107832772A (zh) | 2017-09-20 | 2017-09-20 | 一种基于半监督字典学习的图像识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107832772A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376796A (zh) * | 2018-11-19 | 2019-02-22 | 中山大学 | 基于主动半监督学习的图像分类方法 |
CN109522961A (zh) * | 2018-11-23 | 2019-03-26 | 中山大学 | 一种基于字典深度学习的半监督图像分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095863A (zh) * | 2015-07-14 | 2015-11-25 | 西安电子科技大学 | 基于相似性权值的半监督字典学习的人体行为识别方法 |
CN105279517A (zh) * | 2015-09-30 | 2016-01-27 | 西安电子科技大学 | 基于半监督关系主题模型的弱标签社交图像识别方法 |
CN105809107A (zh) * | 2016-02-23 | 2016-07-27 | 深圳大学 | 基于面部特征点的单样本人脸识别方法及系统 |
CN106778863A (zh) * | 2016-12-12 | 2017-05-31 | 武汉科技大学 | 基于Fisher判别字典学习的仓库货品识别方法 |
-
2017
- 2017-09-20 CN CN201710854155.5A patent/CN107832772A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095863A (zh) * | 2015-07-14 | 2015-11-25 | 西安电子科技大学 | 基于相似性权值的半监督字典学习的人体行为识别方法 |
CN105279517A (zh) * | 2015-09-30 | 2016-01-27 | 西安电子科技大学 | 基于半监督关系主题模型的弱标签社交图像识别方法 |
CN105809107A (zh) * | 2016-02-23 | 2016-07-27 | 深圳大学 | 基于面部特征点的单样本人脸识别方法及系统 |
CN106778863A (zh) * | 2016-12-12 | 2017-05-31 | 武汉科技大学 | 基于Fisher判别字典学习的仓库货品识别方法 |
Non-Patent Citations (2)
Title |
---|
HEYOU CHANG ET AL: "A bottom-up dictionary learning based classification for face recognition", 《2015 3RD IAPR ASIAN CONFERENCE ON PATTERN RECOGNITION》 * |
MENG YANG ET AL: "Discriminative Semi-Supervised Dictionary Learning with Entropy Regularization for Pattern Classification", 《PROCEEDINGS OF THE THIRTY-FIRST AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109376796A (zh) * | 2018-11-19 | 2019-02-22 | 中山大学 | 基于主动半监督学习的图像分类方法 |
CN109522961A (zh) * | 2018-11-23 | 2019-03-26 | 中山大学 | 一种基于字典深度学习的半监督图像分类方法 |
CN109522961B (zh) * | 2018-11-23 | 2022-09-13 | 中山大学 | 一种基于字典深度学习的半监督图像分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105678250B (zh) | 视频中的人脸识别方法和装置 | |
CN104866829B (zh) | 一种基于特征学习的跨年龄人脸验证方法 | |
Chen et al. | Ambiguously labeled learning using dictionaries | |
Liu et al. | Feature disentangling machine-a novel approach of feature selection and disentangling in facial expression analysis | |
Lucey et al. | A GMM parts based face representation for improved verification through relevance adaptation | |
CN100487720C (zh) | 人脸对照装置 | |
CN108229330A (zh) | 人脸融合识别方法及装置、电子设备和存储介质 | |
US20230085401A1 (en) | Method of training an image classification model | |
CN102968626B (zh) | 一种人脸图像匹配的方法 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN105678261B (zh) | 基于有监督图的直推式数据降维方法 | |
CN110659665A (zh) | 一种异维特征的模型构建方法及图像识别方法、装置 | |
CN105574475A (zh) | 一种基于共同向量词典的稀疏表示分类方法 | |
Chanti et al. | Improving bag-of-visual-words towards effective facial expressive image classification | |
CN106897669A (zh) | 一种基于一致迭代多视角迁移学习的行人再辨识方法 | |
CN105893952A (zh) | 基于pca方法的手写签名识别方法 | |
CN109255289A (zh) | 一种基于统一式生成模型的跨衰老人脸识别方法 | |
CN113449704B (zh) | 人脸识别模型训练方法、装置、电子设备及存储介质 | |
CN105389588B (zh) | 基于多语义码本图像特征表示方法 | |
CN108537257A (zh) | 基于判别性字典矩阵对的零样本分类方法 | |
CN110096948A (zh) | 基于特征聚合卷积网络的遥感影像识别方法 | |
CN113496277A (zh) | 用于检索图像的神经网络装置及其操作方法 | |
CN107220656A (zh) | 一种基于自适应特征降维的多标记数据分类方法 | |
CN113435335A (zh) | 微观表情识别方法、装置、电子设备及存储介质 | |
CN112101087A (zh) | 一种面部图像身份去识别方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180323 |
|
RJ01 | Rejection of invention patent application after publication |