CN109165551A - 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 - Google Patents
一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 Download PDFInfo
- Publication number
- CN109165551A CN109165551A CN201810772516.6A CN201810772516A CN109165551A CN 109165551 A CN109165551 A CN 109165551A CN 201810772516 A CN201810772516 A CN 201810772516A CN 109165551 A CN109165551 A CN 109165551A
- Authority
- CN
- China
- Prior art keywords
- feature
- image
- indicates
- lbp
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/174—Facial expression recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,通过将结构张量特征和LBP特征进行融合使得图像特征既包含纹理细节信息又包含纹理结构信息,从而拥有更强的描述能力。结果表明该方法提高了表情识别的准确率。
Description
技术领域
本发明涉及图像处理和计算机视觉领域,更具体地,涉及一种自适应加权融合显著性结构张量和LBP特征的表情识别方法。
背景技术
近年来,表情识别在教育、心理分析、医学以及商业领域引起了广泛关注。表情识别主要由图像预处理、特征提取和分类识别三部分组成。在特征提取方面,比较常用的特征主要有颜色、纹理、梯度、深度等。LBP纹理特征由于在人脸图像分析时对诸如姿态和光照等因素的变化时仍表现很强的鲁棒性,并且运算速度快,得到了广泛应用。然而传统的LBP只考虑了中心像素与邻域像素的差异,没有考虑差值幅度,丢失了图像的结构信息。Guo等提出了完全局部二值模式(CLBP)算法,该算法提取的特征具有较强的鉴别力,但是CLBP包含过多的冗余信息,增加了时间复杂度。Yang等人利用LBP和SVM决策树进行表情识别,识别率达到92%。该方法虽然识别率较高,但是单一特征不能有效全面地描述表情图像的详细信息。郑永斌等将SIFT与LBP进行结合,得到一种新的图像描述和匹配算法,但是该方法具有“不准确性”,且消耗内存。这些方法相比于传统的LBP都具有不同的优势,但是都没寻找到与LBP具有互补性的一种方法来提取更有效且全面的特征。
发明内容
本发明的目的是解决上述一个或多个缺陷,提出一种自适应加权融合显著性结构张量和LBP特征的表情识别方法。
为实现以上发明目的,采用的技术方案是:
一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,包括以下步骤:
S1:数据预处理,选择不同的表情图片组成训练集和测试集,提取纯人脸图片,对表情图像进行校正和尺寸归一化,只留下人脸区域,将头发区域、耳朵区域和脖子区域去除;
S2:获取显著图,将预处理后的数据集用频率调谐显著性区域检测算法提取人脸的显著性区域,得到各种表情的显著图,其中表情的显著性区域主要集中在眼睛区域、鼻子区域、嘴巴区域;
S3:特征提取,提取显著性纹理特征,在显著图的基础上提取LBP特征和结构张量特征;
S4:特征融合,通过计算不同子块结构张量特征直方图和LBP特征直方图的信息熵,根据信息熵的贡献度作为加权因子来进行融合得到每个子块的特征向量,最后把每个子块的特征向量连接起来作为最终的分类特征,具体实现过程如下:
先将显著图划分成k×k个子区域,计算每个子区域的两种特征的信息熵:
上式中Em表示第m子块的信息熵的值,n表示像素值255,pm(i)表示像素值i出现的概率;
然后根据每一子区域的特征信息熵在两种特征信息熵E总和的占比来决定相应的权重系数。根据权重系数来加权融合两种纹理特征:
Hm=w*HLBP+(1-w)HST
式中wm表示第m子块的LBP特征的加权值,EmLBP表示LBP特征的信息熵,EmST表示结构张量特征的信息熵,Hm表示融合后的新特征;
最后将各个子块的特征向量按顺序串接组合起来,得到最终的联合特征向量:
H=[H1,H2,H3L,Hm,L Hk×k]。
S5:分类识别,将测试集和训练集新的特征送入支持向量机(SVM)进行分类测试。
优选的是,步骤S1所述纯人脸图像提取为采用snake和GVF模型进行提取。
优选的是,步骤S1所述表情图片所在的数据库为JAFFE表情库或CK+数据库。
优选的是,步骤S2所述显著图的获取包括以下步骤:
S2.1:对图像I进行高斯模糊处理,消除噪声,得到一张新的图像Ig:
上式中(i,j)表示像素坐标,“*”表示卷积操作,G表示高斯平滑滤波器;
S2.2:将原图像I和图像Ig从RGB颜色空间转换到Lab颜色空间。计算原图像转换到Lab颜色空间后,整副图像对应每个特征的均值Lμ,aμ,bμ:
上式中的L,a,b表示Lab色彩空间的三个分量;
S2.3:对于图像的每个像素点,计算显著值:
S(i,j)=‖Iμ-Iωhc‖
上式中的Iμ表示均值图像的特征向量,Iωhc表示高斯图像的特征向量,‖‖表示欧式距离。
与现有技术相比,本发明的有益效果是:
1)本发明对于现有技术而言,在特征提取前,本发明先对表情图像进行显著性检测得到表情图像的显著图,基于显著图提取特征可以拉伸表情关键区域和无关区域的对比度,同时可以抑制噪声。此外,显著图能够凸显出图像的全局结构信息,增强图像的纹理信息,有助于特征提取的准确性;
2)本发明针对LBP特征提取局部特征时丢失了结构信息,将结构张量特征与LBP特征进行融合,使得融合的特征可以更加准确的描述表情,在一定程度上消除了冗余信息,两种信息都是局部信息,既有互补也有冗余,通过特征融合可以将冗余特征去除;
3)本发明相对于现有的特征融合技术,本发明将信息熵运用到特征融合上,信息熵越大的特征,表明纹理信息越丰富,反之,纹理信息越稀疏;在特征融合时,根据信息熵的大小来衡量特征的贡献度,使得最终融合的特征增加更多图像的纹理信息,从而更有效地描述图像局部信息。最终的实验结果也表明,该方法提高了表情识别的识别率。
附图说明
图1为本发明所述方法的步骤流程图;
图2(a)为本发明所述JAFFE数据集的7种表情预处理图;
图2(b)为本发明所述JAFFE数据集的7种表情显著图;
图3(a)为本发明所述CK+数据集的显著图;
图3(b)为本发明所述基于显著图提取的结构张量特征图;
图3(c)为本发明所述基于显著图提取的LBP特征图;
图4为本发明所述对显著图进行分块的示意图;
图5为本发明所述对显著图进行不同分块模式下表情识别的识别率。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,如图1所示,包括以下步骤:
S1:数据预处理。在表情数据库中选折不同的表情图像组成训练集测试集,然后采用snake和GVF模型提取表情图像的纯人脸区域,去掉了头发、耳朵、脖子、背景等对表情识别有干扰的信息。最后,对图像进行尺度归一化,效果图如图2(a)所示。
在本实例中,选择JAFFE表情库作为实验数据,库中表情分别分为:生气、厌恶、害怕、高兴、悲伤、惊讶、中性七类表情。本实例中每类表情选择了10张组成测试集,剩下的作为训练集。本实例同样在CK+数据库进行了实验,选取了7种表情25个人的表情图像组成训练集,选取15个人组成测试集。
S2:获取显著图。将预处理后的数据集用频率调谐显著性区域检测算法提取人脸的显著性区域,得到各种表情的显著图,如图2(b)所示。显著图的获取步骤如下:
S2.1:对图像I进行高斯模糊处理,消除噪声,得到一张新的图像Ig:
上式中(i,j)表示像素坐标,“*”表示卷积操作,G表示高斯平滑滤波器;
S2.2:将原图像I和图像Ig从RGB颜色空间转换到Lab颜色空间。计算原图像转换到Lab颜色空间后,整副图像对应每个特征的均值Lμ,aμ,bμ:
上式中的L,a,b表示Lab色彩空间的三个分量;
S2.3:对于图像的每个像素点,计算显著值:
S(i,j)=‖Iμ-Iωhc‖
上式中的Iμ表示均值图像的特征向量,Iωhc表示高斯图像的特征向量,‖‖表示欧式距离。
S3:特征提取。提取显著性纹理特征,在显著图的基础上提取LBP特征和结构张量。LBP纹理特征更多是描述图像局部的细节信息,结构张量侧重于图像的局部结构信息,结构张量特征和LBP特征的效果图如图3(b)和图3(c)所示。
S4:特征融合。通过计算不同子块结构张量特征直方图和LBP特征直方图的信息熵,根据信息熵的贡献度作为加权因子来进行融合得到每个子块的特征向量,最后把每个子块的特征向量连接起来作为最终的分类特征,显著图的分块效果图如图4所示。具体实现过程如下:
先将显著图划分成k×k个子区域,计算每个子区域的两种特征的信息熵:
上式中Em表示第m子块的信息熵的值,n表示像素值255,pm(i)表示像素值i出现的概率;
然后根据每一子区域的特征信息熵在两种特征信息熵E总和的占比来决定相应的权重系数。根据权重系数来加权融合两种纹理特征:
Hm=w*HLBP+(1-w)HST
式中wm表示第m子块的LBP特征的加权值,EmLBP表示LBP特征的信息熵,EmST表示结构张量特征的信息熵,Hm表示融合后的新特征;
最后将各个子块的特征向量按顺序串接组合起来,得到最终的联合特征向量:
H=[H1,H2,H3L,Hm,L Hk×k]。
由于图像不同区域包含的纹理信息有很大的差异,为了区分不同区域的纹理信息,本案例中将图像进行不同模式的分块,本案例主要将显著图分成了3×3、4×4、5×5、6×6、7×7五种模式,在JAFFE和CK+数据库上进行了实验,结果如图5所示,结果表明不同的分类模式对最终的识别率有很大的影响。
S5:分类识别。将融合的新特征送入支持向量机(SVM)进行分类测试,本案例中核函数选取的是高斯核函数。高斯核函数局部特征性强,具有较好的学习能力。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (4)
1.一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,其特征在于,包括以下步骤:
S1:数据预处理,选择不同的表情图片组成训练集和测试集,提取纯人脸图片,对表情图像进行校正和尺寸归一化,只留下人脸区域,将头发区域、耳朵区域和脖子区域去除;
S2:获取显著图,将预处理后的数据集用频率调谐显著性区域检测算法提取人脸的显著性区域,得到各种表情的显著图,其中表情的显著性区域主要集中在眼睛区域、鼻子区域、嘴巴区域;
S3:特征提取,提取显著性纹理特征,在显著图的基础上提取LBP特征和结构张量特征;
S4:特征融合,通过计算不同子块结构张量特征直方图和LBP特征直方图的信息熵,根据信息熵的贡献度作为加权因子来进行融合得到每个子块的特征向量,最后把每个子块的特征向量连接起来作为最终的分类特征,具体实现过程如下:
先将显著图划分成k×k个子区域,计算每个子区域的两种特征的信息熵:
上式中Em表示第m子块的信息熵的值,n表示像素值255,pm(i)表示像素值i出现的概率;
然后根据每一子区域的特征信息熵在两种特征信息熵E总和的占比来决定相应的权重系数。根据权重系数来加权融合两种纹理特征:
Hm=w*HLBP+(1-w)HST
式中wm表示第m子块的LBP特征的加权值,EmLBP表示LBP特征的信息熵,EmST表示结构张量特征的信息熵,Hm表示融合后的新特征;
最后将各个子块的特征向量按顺序串接组合起来,得到最终的联合特征向量:
H=[H1,H2,H3L,Hm,L Hk×k]。
S5:分类识别,将测试集和训练集新的特征送入支持向量机(SVM)进行分类测试。
2.根据权利要求1所述的一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,其特征在于,步骤S1所述纯人脸图像提取为采用snake和GVF模型进行提取。
3.根据权利要求1所述的一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,其特征在于,步骤S1所述表情图片所在的数据库为JAFFE表情库或CK+数据库。
4.根据权利要求1所述的一种自适应加权融合显著性结构张量和LBP特征的表情识别方法,其特征在于,步骤S2所述显著图的获取包括以下步骤:
S2.1:对图像I进行高斯模糊处理,消除噪声,得到一张新的图像Ig:
上式中(i,j)表示像素坐标,“*”表示卷积操作,G表示高斯平滑滤波器;
S2.2:将原图像I和图像Ig从RGB颜色空间转换到Lab颜色空间。计算原图像转换到Lab颜色空间后,整副图像对应每个特征的均值Lμ,aμ,bμ:
上式中的L,a,b表示Lab色彩空间的三个分量;
S2.3:对于图像的每个像素点,计算显著值:
S(i,j)=‖Iμ-Iωhc‖
上式中的Iμ表示均值图像的特征向量,Iωhc表示高斯图像的特征向量,‖‖表示欧式距离。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810772516.6A CN109165551B (zh) | 2018-07-13 | 2018-07-13 | 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810772516.6A CN109165551B (zh) | 2018-07-13 | 2018-07-13 | 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109165551A true CN109165551A (zh) | 2019-01-08 |
CN109165551B CN109165551B (zh) | 2021-08-31 |
Family
ID=64897939
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810772516.6A Active CN109165551B (zh) | 2018-07-13 | 2018-07-13 | 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109165551B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977860A (zh) * | 2019-03-25 | 2019-07-05 | 上海商汤智能科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111797936A (zh) * | 2020-07-13 | 2020-10-20 | 长沙理工大学 | 基于显著性检测和多层次特征融合的图像情感分类方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130271361A1 (en) * | 2012-04-17 | 2013-10-17 | Samsung Electronics Co., Ltd. | Method and apparatus for detecting talking segments in a video sequence using visual cues |
CN103488974A (zh) * | 2013-09-13 | 2014-01-01 | 南京华图信息技术有限公司 | 基于模拟生物视觉神经网络的人脸表情识别方法及系统 |
CN107273845A (zh) * | 2017-06-12 | 2017-10-20 | 大连海事大学 | 一种基于置信区域和多特征加权融合的人脸表情识别方法 |
-
2018
- 2018-07-13 CN CN201810772516.6A patent/CN109165551B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130271361A1 (en) * | 2012-04-17 | 2013-10-17 | Samsung Electronics Co., Ltd. | Method and apparatus for detecting talking segments in a video sequence using visual cues |
CN103488974A (zh) * | 2013-09-13 | 2014-01-01 | 南京华图信息技术有限公司 | 基于模拟生物视觉神经网络的人脸表情识别方法及系统 |
CN107273845A (zh) * | 2017-06-12 | 2017-10-20 | 大连海事大学 | 一种基于置信区域和多特征加权融合的人脸表情识别方法 |
Non-Patent Citations (1)
Title |
---|
罗源,张灵,陈云华等: "基于层次结构化字典学习的人脸表情识别", 《计算机应用研究》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109977860A (zh) * | 2019-03-25 | 2019-07-05 | 上海商汤智能科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111797936A (zh) * | 2020-07-13 | 2020-10-20 | 长沙理工大学 | 基于显著性检测和多层次特征融合的图像情感分类方法及装置 |
CN111797936B (zh) * | 2020-07-13 | 2023-08-08 | 长沙理工大学 | 基于显著性检测和多层次特征融合的图像情感分类方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109165551B (zh) | 2021-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4755202B2 (ja) | 顔特徴の検出方法 | |
CN109670430A (zh) | 一种基于深度学习的多分类器融合的人脸活体识别方法 | |
CN110728302A (zh) | 一种基于HSV和Lab颜色空间的色纺织物组织识别的方法 | |
Phimoltares et al. | Face detection and facial feature localization without considering the appearance of image context | |
Abidin et al. | Copy-move image forgery detection using deep learning methods: a review | |
Ajmera et al. | 3D face recognition using kinect | |
CN108537143B (zh) | 一种基于重点区域特征比对的人脸识别方法与系统 | |
WenJuan et al. | A real-time lip localization and tacking for lip reading | |
CN108875623A (zh) | 一种基于图像特征融合对比技术的人脸识别方法 | |
Chen et al. | Single depth image super-resolution using convolutional neural networks | |
CN111079688A (zh) | 一种人脸识别中的基于红外图像的活体检测的方法 | |
CN109165551A (zh) | 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法 | |
CN113807237A (zh) | 活体检测模型的训练、活体检测方法、计算机设备及介质 | |
Grigoryan et al. | Color facial image representation with new quaternion gradients | |
Mehrara et al. | Novel edge detection using BP neural network based on threshold binarization | |
Das et al. | Human face detection in color images using HSV color histogram and WLD | |
CN110210561B (zh) | 神经网络的训练方法、目标检测方法及装置、存储介质 | |
Sudhakara et al. | An edge detection mechanism using L* A* B color-based contrast enhancement for underwater images | |
Borah et al. | ANN based human facial expression recognition in color images | |
Chowdhury et al. | Fuzzy rule based approach for face and facial feature extraction in biometric authentication | |
CN105828061A (zh) | 一种基于视觉掩蔽效应的虚拟视点质量评价方法 | |
CN106611417A (zh) | 将视觉元素分类为前景或背景的方法及装置 | |
Liang et al. | Applying Image Processing Technology to Face Recognition. | |
CN113724273A (zh) | 一种基于神经网络区域目标分割的边缘光影融合方法 | |
CN108198140A (zh) | 基于ncsr模型的三维协同滤波去噪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |