CN106210820A - 一种交互性能良好的智能电视系统 - Google Patents

一种交互性能良好的智能电视系统 Download PDF

Info

Publication number
CN106210820A
CN106210820A CN201610616485.6A CN201610616485A CN106210820A CN 106210820 A CN106210820 A CN 106210820A CN 201610616485 A CN201610616485 A CN 201610616485A CN 106210820 A CN106210820 A CN 106210820A
Authority
CN
China
Prior art keywords
intelligent television
module
mobile phone
smart mobile
television system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610616485.6A
Other languages
English (en)
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610616485.6A priority Critical patent/CN106210820A/zh
Publication of CN106210820A publication Critical patent/CN106210820A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/4104Peripherals receiving signals from specially adapted client devices
    • H04N21/4126The peripheral being portable, e.g. PDAs or mobile phones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/63Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for estimating an emotional state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • H04N21/42206User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor characterized by hardware details
    • H04N21/42222Additional components integrated in the remote control device, e.g. timer, speaker, sensors for detecting position, direction or movement of the remote control, microphone or battery charging device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/441Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card
    • H04N21/4415Acquiring end-user identification, e.g. using personal code sent by the remote control or by inserting a card using biometric characteristics of the user, e.g. by voice recognition or fingerprint scanning

Abstract

本发明提供了一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换。本发明通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。

Description

一种交互性能良好的智能电视系统
技术领域
本发明涉及智能电视领域,具体涉及一种交互性能良好的智能电视系统。
背景技术
智能电视极大的方便了人们的生活,但是应用程序占用了智能电视的很大存储空间。
情感在人们相互交际过程中起着极其重要的作用。借助情感表达所伴随着的外在表现信息,如情感化的语音信号或面部表情,人们可以很方便地相互沟通、相互了解。对于人类情感方面的研究,一直是生理学、神经学、心理学等领域的重要研究方向,近几年来倍受工程领域研究者的关注。当前,对于单模态情感研究较多,但是对于多模态情感融合的研究较为有限。
发明内容
针对上述问题,本发明提供一种交互性能良好的智能电视系统。
本发明的目的采用以下技术方案来实现:
一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
优选地,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
优选地,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
本发明的有益效果为:通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明智能电视系统的结构示意图;
图2是本发明情感控制系统的结构示意图。
附图标记:
语音情感识别处理模块1、表情情感识别处理模块2、多模态情感融合识别处理模块3、控制模块4、声学特征提取子模块11、声学特征降维子模块12、语音情感分类处理子模块13、表情特征提取子模块21、表情特征降维子模块22、表情情感分类处理子模块23。
具体实施方式
结合以下实施例对本发明作进一步描述。
应用场景1
参见图1、图2,本应用场景中的一个具体实施例一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
优选地,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
本优选实施例通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。
优选地,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
本优选实施例方便维修。
优选地,所述情感控制系统包括语音情感识别处理模块1、表情情感识别处理模块2、多模态情感融合识别处理模块3和控制模块4:
(1)语音情感识别处理模块1,用于获取用户的语音信号,并对语音信号进行处理,最终输出语音情感识别结果,其包括声学特征提取子模块11、声学特征降维子模块12和语音情感分类处理子模块13;所述声学特征提取子模块11用于提取声学特征数据;所述声学特征降维子模块12用于采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理;所述语音情感分类处理子模块13用于采用已训练好的支持向量机作为语音情感识别分类器,对降维后的声学特征数据进行情感识别并输出语音情感识别结果,支持向量机的核函数采用高斯核函数;
(2)表情情感识别处理模块2,用于获取用户的表情图像,并对表情图像特征进行处理,最终生成表情情感识别结果,其包括表情特征提取子模块21、表情特征降维子模块22和表情情感分类处理子模块23;所述表情特征提取子模块21用于采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取;所述表情特征降维子模块22用于采用所述改进的局部线性嵌入方法对所述表情特征数据进行降维处理,并采用形态学处理方法做滤波处理;所述表情情感分类处理子模块23用于采用已训练好的稀疏分类器作为表情情感识别分类器,对降维、滤波处理后的表情特征数据进行情感识别并输出表情情感识别结果;
(3)多模态情感融合识别处理模块3,用于基于所述语音情感识别结果和表情情感识别结果,根据预定的多模态情感融合策略生成用户情感识别结果;
(4)控制模块,用于根据所述用户情感识别结果,在验证用户身份的前提下控制智能电视系统执行相应的操作。
本优选实施例设置多模态情感融合识别处理模块3,基于所述语音情感识别结果和表情情感识别结果,增强了识别结果的可靠性。
优选地,所述用户情感识别结果包括高级别和低级别的褒义情感,中性情感以及高级别和低级别的贬义情感组成的5个级别情感类型。
所述在验证用户身份的前提下控制智能电视系统执行相应的操作,具体为:所述控制模块基于预先设置的语音特征数据库,匹配所述用户的语音信号的语音特征,从而进行用户身份验证,若验证通过,控制模块控制智能电视系统执行相应的操作。
所述采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理,包括:
(1)将提取的声学特征数据中的声学特征向量看成是高维空间中的样本数据点,设M维的N个样本数据点为Xi,Xi∈RM,i∈[1,N],类别号为Ci,嵌入输出的N个m维的降维数据点为Yi,Yi∈Rm,i∈[1,N],m≤M,且m值的范围为[2,20],对每个样本数据点Xi确定其邻域点的数目K,邻域点的距离公式为:
L ′ = 1 - e - L λ , C i = C j L + δ 1 max ( L ) + δ 2 min ( L ) , C i ≠ C j
式中,L′是结合样本数据点类别信息计算后的距离,L是忽略样本数据点类别信息的原始欧氏距离,参数λ用来防止L过快增长,max(L)表示最大欧氏距离,min(L)表示最小欧式距离,常数因子δ1、δ2(0≤δ1、δ2≤1),共同控制距离计算时样本数据点类别信息的结合数量程度;
(2)利用每个样本数据点Xi的邻域点计算出样本数据点的局部重建权值矩阵Wij,要求最小化下列损失函数:
s ( W ) = Σ i = 1 N | | X i - Σ j = 1 K W i j X j | | 2
式中,Wij为Xi与Xj之间的权值,且需满足对Xi的非邻域点,Wij=0;
(3)计算各样本数据点Xi的K个邻域点的权重之和:
Q i j = Σ j = 1 K Z i j
其中,
式中,Zij为各邻域点之间的加权矩阵,d(Xi,Xj)表示样本数据点间的Fisher投影距离,ξ为可调参数;
(4)利用该样本数据点的局部重建权值矩阵Wij以及其邻域点计算出该样本数据点的输出值,具体是将所有的样本数据点Xi映射嵌入到低维空间中,并使得低维重构的误差达到最小,要求最小化下列损失函数:
ω ( Y ) = Σ i = 1 N Q i j | | Y i - Σ X j ∈ Ω ( X i ) W i j Y j | | 2 = t r ( YMY T )
式中,需满足其中构建一个稀疏矩阵M=(I-W)T(I-W),通过求解这个稀疏矩阵的前m个最小的非零特征值所对应的特征向量作为样本数据点Xi的嵌入输出值。
所述自适应二维Gabor小波变换方法中的Gabor滤波器的核函数定义为:
Φ α , β = | | k α , β | | 2 σ 2 e - | | k α , β | | 2 | | z | | 2 2 σ 2 [ e ik α , β z - e - σ 2 2 ]
式中,α、β分别表示核函数的方向和频率大小,α、β按照按如下方法设置:当表情图像质量较好时,选取三个中心频率β={0,1,2}和六个方向α={0,1,…,5}组成的18个Gabor滤波器用于特征提取;当表情图像受到腐蚀、遮挡时,选取四个中心频率β={0,1…,3}和八个方向α={0,1,…,7}组成的32个Gabor滤波器用于特征提取;
σ表示采用高斯函数窗口的大小,用来决定滤波器的带宽,σ能够根据参数设置进行自适应调整:将表情图像分成v×v子块,根据每个子块特征数目选择σ,特征数目大的子块设定σ=π,特征数目少的子块设定σ=2π;
kα,β为小波矢量,其中,kβ分别表示Gabor滤波器在频率和方向空间的采样方式。
所述预定的多模态情感融合策略为:
设已经计算出一个测试样本x对于c类的分类情况下,采用n个分类器进行分类得到的后验概率集合为{pij(x),i=1,2,…,n,j=1,2,…,c},对n个分类器取得的后验概率按照方差规则集成得到一个新的后验概率集合{qj(x),j=1,2,…,c},从中按照预定的挑选规则挑选出合适的后验概率值所对应的类别作为要输出的用户情感识别结果;
对于j类测试样本,按照方差规则获得的新的后验概率qj(x)可表示为:
q j ( x ) = q j ′ ( x ) Σ j q j ′ ( x )
式中,
q j ′ ( x ) = 1 n Σ i = 1 n ( p i j ( x ) - 1 n Σ i = 1 n p i j ( x ) ) 2
对于j类测试样本,最终所获得的识别类别可表示为:
ρ(x)=argmaxj(qj(x))
其中,所述预定的挑选规则为:将所述新的后验概率集合中的后验概率值按照从大到小顺序进行排列的前3个后验概率值为qj(x)max,qj(x)max-1,qj(x)max-2,若 选择qj(x)max作为合适的后验概率值,否则选择qj(x)max-1作为合适的后验概率值,其中Qq为设定的后验概率权值,取值范围为[1.4,1.6]。
本优选实施例设置改进的局部线性嵌入方法,需要确定的参数比较少,只有邻域数k和输出维数d,大大减少了运算量,且可以学习出任意维数的低维流形,提高了识别速度;采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取,具有旋转、平移以及伸缩变换条件下不变的性质,而且能得到一个解析的全局最优解;在声学特征降维子模块12对声学特征数据进行降维处理的过程中,计算各样本数据点Xi的K个邻域点的权重之和,并将其考虑到低维重构的损失函数中,降低了噪声的影响和数据样本外点对降维的干扰,进一步提高了情感识别的精度;设置预定的多模态情感融合策略,并根据多模态情感融合策略生成用户情感识别结果,使识别结果更加可靠准确。
本应用场景设定后验概率权值为Qq=1.4,识别精度相对提高了12%。
应用场景2
参见图1、图2,本应用场景中的一个具体实施例一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
优选地,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
本优选实施例通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。
优选地,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
本优选实施例方便维修。
优选地,所述情感控制系统包括语音情感识别处理模块1、表情情感识别处理模块2、多模态情感融合识别处理模块3和控制模块4:
(1)语音情感识别处理模块1,用于获取用户的语音信号,并对语音信号进行处理,最终输出语音情感识别结果,其包括声学特征提取子模块11、声学特征降维子模块12和语音情感分类处理子模块13;所述声学特征提取子模块11用于提取声学特征数据;所述声学特征降维子模块12用于采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理;所述语音情感分类处理子模块13用于采用已训练好的支持向量机作为语音情感识别分类器,对降维后的声学特征数据进行情感识别并输出语音情感识别结果,支持向量机的核函数采用高斯核函数;
(2)表情情感识别处理模块2,用于获取用户的表情图像,并对表情图像特征进行处理,最终生成表情情感识别结果,其包括表情特征提取子模块21、表情特征降维子模块22和表情情感分类处理子模块23;所述表情特征提取子模块21用于采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取;所述表情特征降维子模块22用于采用所述改进的局部线性嵌入方法对所述表情特征数据进行降维处理,并采用形态学处理方法做滤波处理;所述表情情感分类处理子模块23用于采用已训练好的稀疏分类器作为表情情感识别分类器,对降维、滤波处理后的表情特征数据进行情感识别并输出表情情感识别结果;
(3)多模态情感融合识别处理模块3,用于基于所述语音情感识别结果和表情情感识别结果,根据预定的多模态情感融合策略生成用户情感识别结果;
(4)控制模块,用于根据所述用户情感识别结果,在验证用户身份的前提下控制智能电视系统执行相应的操作。
本优选实施例设置多模态情感融合识别处理模块3,基于所述语音情感识别结果和表情情感识别结果,增强了识别结果的可靠性。
优选地,所述用户情感识别结果包括高级别和低级别的褒义情感,中性情感以及高级别和低级别的贬义情感组成的5个级别情感类型。
所述在验证用户身份的前提下控制智能电视系统执行相应的操作,具体为:所述控制模块基于预先设置的语音特征数据库,匹配所述用户的语音信号的语音特征,从而进行用户身份验证,若验证通过,控制模块控制智能电视系统执行相应的操作。
所述采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理,包括:
(1)将提取的声学特征数据中的声学特征向量看成是高维空间中的样本数据点,设M维的N个样本数据点为Xi,Xi∈RM,i∈[1,N],类别号为Ci,嵌入输出的N个m维的降维数据点为Yi,Yi∈Rm,i∈[1,N],m≤M,且m值的范围为[2,20],对每个样本数据点Xi确定其邻域点的数目K,邻域点的距离公式为:
L ′ = 1 - e - L λ , C i = C j L + δ 1 m a x ( L ) + δ 2 m i n ( L ) , C i ≠ C j
式中,L′是结合样本数据点类别信息计算后的距离,L是忽略样本数据点类别信息的原始欧氏距离,参数λ用来防止L过快增长,max(L)表示最大欧氏距离,min(L)表示最小欧式距离,常数因子δ1、δ2(0≤δ1、δ2≤1),共同控制距离计算时样本数据点类别信息的结合数量程度;
(2)利用每个样本数据点Xi的邻域点计算出样本数据点的局部重建权值矩阵Wij,要求最小化下列损失函数:
s ( W ) = Σ i = 1 N | | X i - Σ j = 1 K W i j X j | | 2
式中,Wij为Xi与Xj之间的权值,且需满足对Xi的非邻域点,Wij=0;
(3)计算各样本数据点Xi的K个邻域点的权重之和:
Q i j = Σ j = 1 K Z i j
其中,
式中,Zij为各邻域点之间的加权矩阵,d(Xi,Xj)表示样本数据点间的Fisher投影距离,ξ为可调参数;
(4)利用该样本数据点的局部重建权值矩阵Wij以及其邻域点计算出该样本数据点的输出值,具体是将所有的样本数据点Xi映射嵌入到低维空间中,并使得低维重构的误差达到最小,要求最小化下列损失函数:
ω ( Y ) = Σ i = 1 N Q i j | | Y i - Σ X j ∈ Ω ( X i ) W i j Y j | | 2 = t r ( YMY T )
式中,需满足其中构建一个稀疏矩阵M=(I-W)T(I-W),通过求解这个稀疏矩阵的前m个最小的非零特征值所对应的特征向量作为样本数据点Xi的嵌入输出值。
所述自适应二维Gabor小波变换方法中的Gabor滤波器的核函数定义为:
Φ α , β = | | k α , β | | 2 σ 2 e - | | k α , β | | 2 | | z | | 2 2 σ 2 [ e ik α , β z - e - σ 2 2 ]
式中,α、β分别表示核函数的方向和频率大小,α、β按照按如下方法设置:当表情图像质量较好时,选取三个中心频率β={0,1,2}和六个方向α={0,1,…,5}组成的18个Gabor滤波器用于特征提取;当表情图像受到腐蚀、遮挡时,选取四个中心频率β={0,1…,3}和八个方向α={0,1,…,7}组成的32个Gabor滤波器用于特征提取;
σ表示采用高斯函数窗口的大小,用来决定滤波器的带宽,σ能够根据参数设置进行自适应调整:将表情图像分成v×v子块,根据每个子块特征数目选择σ,特征数目大的子块设定σ=π,特征数目少的子块设定σ=2π;
kα,β为小波矢量,其中,kβ分别表示Gabor滤波器在频率和方向空间的采样方式。
所述预定的多模态情感融合策略为:
设已经计算出一个测试样本x对于c类的分类情况下,采用n个分类器进行分类得到的后验概率集合为{pij(x),i=1,2,…,n,j=1,2,…,c},对n个分类器取得的后验概率按照方差规则集成得到一个新的后验概率集合{qj(x),j=1,2,…,c},从中按照预定的挑选规则挑选出合适的后验概率值所对应的类别作为要输出的用户情感识别结果;
对于j类测试样本,按照方差规则获得的新的后验概率qj(x)可表示为:
q j ( x ) = q j ′ ( x ) Σ j q j ′ ( x )
式中,
q j ′ ( x ) = 1 n Σ i = 1 n ( p i j ( x ) - 1 n Σ i = 1 n p i j ( x ) ) 2
对于j类测试样本,最终所获得的识别类别可表示为:
ρ(x)=argmaxj(qj(x))
其中,所述预定的挑选规则为:将所述新的后验概率集合中的后验概率值按照从大到小顺序进行排列的前3个后验概率值为qj(x)max,qj(x)max-1,qj(x)max-2,若 选择qj(x0max作为合适的后验概率值,否则选择qj(x)max-1作为合适的后验概率值,其中Qq为设定的后验概率权值,取值范围为[1.4,1.6]。
本优选实施例设置改进的局部线性嵌入方法,需要确定的参数比较少,只有邻域数k和输出维数d,大大减少了运算量,且可以学习出任意维数的低维流形,提高了识别速度;采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取,具有旋转、平移以及伸缩变换条件下不变的性质,而且能得到一个解析的全局最优解;在声学特征降维子模块12对声学特征数据进行降维处理的过程中,计算各样本数据点Xi的K个邻域点的权重之和,并将其考虑到低维重构的损失函数中,降低了噪声的影响和数据样本外点对降维的干扰,进一步提高了情感识别的精度;设置预定的多模态情感融合策略,并根据多模态情感融合策略生成用户情感识别结果,使识别结果更加可靠准确。
本应用场景设定后验概率权值为Qq=1.45,识别精度相对提高了10%。
应用场景3
参见图1、图2,本应用场景中的一个具体实施例一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
优选地,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
本优选实施例通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。
优选地,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
本优选实施例方便维修。
优选地,所述情感控制系统包括语音情感识别处理模块1、表情情感识别处理模块2、多模态情感融合识别处理模块3和控制模块4:
(1)语音情感识别处理模块1,用于获取用户的语音信号,并对语音信号进行处理,最终输出语音情感识别结果,其包括声学特征提取子模块11、声学特征降维子模块12和语音情感分类处理子模块13;所述声学特征提取子模块11用于提取声学特征数据;所述声学特征降维子模块12用于采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理;所述语音情感分类处理子模块13用于采用已训练好的支持向量机作为语音情感识别分类器,对降维后的声学特征数据进行情感识别并输出语音情感识别结果,支持向量机的核函数采用高斯核函数;
(2)表情情感识别处理模块2,用于获取用户的表情图像,并对表情图像特征进行处理,最终生成表情情感识别结果,其包括表情特征提取子模块21、表情特征降维子模块22和表情情感分类处理子模块23;所述表情特征提取子模块21用于采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取;所述表情特征降维子模块22用于采用所述改进的局部线性嵌入方法对所述表情特征数据进行降维处理,并采用形态学处理方法做滤波处理;所述表情情感分类处理子模块23用于采用已训练好的稀疏分类器作为表情情感识别分类器,对降维、滤波处理后的表情特征数据进行情感识别并输出表情情感识别结果;
(3)多模态情感融合识别处理模块3,用于基于所述语音情感识别结果和表情情感识别结果,根据预定的多模态情感融合策略生成用户情感识别结果;
(4)控制模块,用于根据所述用户情感识别结果,在验证用户身份的前提下控制智能电视系统执行相应的操作。
本优选实施例设置多模态情感融合识别处理模块3,基于所述语音情感识别结果和表情情感识别结果,增强了识别结果的可靠性。
优选地,所述用户情感识别结果包括高级别和低级别的褒义情感,中性情感以及高级别和低级别的贬义情感组成的5个级别情感类型。
所述在验证用户身份的前提下控制智能电视系统执行相应的操作,具体为:所述控制模块基于预先设置的语音特征数据库,匹配所述用户的语音信号的语音特征,从而进行用户身份验证,若验证通过,控制模块控制智能电视系统执行相应的操作。
所述采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理,包括:
(1)将提取的声学特征数据中的声学特征向量看成是高维空间中的样本数据点,设M维的N个样本数据点为Xi,Xi∈RM,i∈[1,N],类别号为Ci,嵌入输出的N个m维的降维数据点为Yi,Yi∈Rm,i∈[1,N],m≤M,且m值的范围为[2,20],对每个样本数据点Xi确定其邻域点的数目K,邻域点的距离公式为:
L ′ = 1 - e - L λ , C i = C j L + δ 1 m a x ( L ) + δ 2 m i n ( L ) , C i ≠ C j
式中,L′是结合样本数据点类别信息计算后的距离,L是忽略样本数据点类别信息的原始欧氏距离,参数λ用来防止L过快增长,max(L)表示最大欧氏距离,min(L)表示最小欧式距离,常数因子δ1、δ2(0≤δ1、δ2≤1),共同控制距离计算时样本数据点类别信息的结合数量程度;
(2)利用每个样本数据点Xi的邻域点计算出样本数据点的局部重建权值矩阵Wij,要求最小化下列损失函数:
s ( W ) = Σ i = 1 N | | X i - Σ j = 1 K W i j X j | | 2
式中,Wij为Xi与Xj之间的权值,且需满足对Xi的非邻域点,Wij=0;
(3)计算各样本数据点Xi的K个邻域点的权重之和:
Q i j = Σ j = 1 K Z i j
其中,
式中,Zij为各邻域点之间的加权矩阵,d(Xi,Xj)表示样本数据点间的Fisher投影距离,ξ为可调参数;
(4)利用该样本数据点的局部重建权值矩阵Wij以及其邻域点计算出该样本数据点的输出值,具体是将所有的样本数据点Xi映射嵌入到低维空间中,并使得低维重构的误差达到最小,要求最小化下列损失函数:
ω ( Y ) = Σ i = 1 N Q i j | | Y i - Σ X j ∈ Ω ( X i ) W i j Y j | | 2 = t r ( YMY T )
式中,需满足其中构建一个稀疏矩阵M=(I-W)T(I-W),通过求解这个稀疏矩阵的前m个最小的非零特征值所对应的特征向量作为样本数据点Xi的嵌入输出值。
所述自适应二维Gabor小波变换方法中的Gabor滤波器的核函数定义为:
Φ α , β = | | k α , β | | 2 σ 2 e - | | k α , β | | 2 | | z | | 2 2 σ 2 [ e ik α , β z - e - σ 2 2 ]
式中,α、β分别表示核函数的方向和频率大小,α、β按照按如下方法设置:当表情图像质量较好时,选取三个中心频率β={0,1,2}和六个方向α={0,1,…,5}组成的18个Gabor滤波器用于特征提取;当表情图像受到腐蚀、遮挡时,选取四个中心频率β={0,1…,3}和八个方向α={0,1,…,7}组成的32个Gabor滤波器用于特征提取;
σ表示采用高斯函数窗口的大小,用来决定滤波器的带宽,σ能够根据参数设置进行自适应调整:将表情图像分成v×v子块,根据每个子块特征数目选择σ,特征数目大的子块设定σ=π,特征数目少的子块设定σ=2π;
kα,β为小波矢量,其中,kβ分别表示Gabor滤波器在频率和方向空间的采样方式。
所述预定的多模态情感融合策略为:
设已经计算出一个测试样本x对于c类的分类情况下,采用n个分类器进行分类得到的后验概率集合为{pij(x),i=1,2,…,n,j=1,2,…,c},对n个分类器取得的后验概率按照方差规则集成得到一个新的后验概率集合{qj(x),j=1,2,…,c},从中按照预定的挑选规则挑选出合适的后验概率值所对应的类别作为要输出的用户情感识别结果;
对于j类测试样本,按照方差规则获得的新的后验概率qj(x)可表示为:
q j ( x ) = q j ′ ( x ) Σ j q j ′ ( x )
式中,
q j ′ ( x ) = 1 n Σ i = 1 n ( p i j ( x ) - 1 n Σ i = 1 n p i j ( x ) ) 2
对于j类测试样本,最终所获得的识别类别可表示为:
ρ(x)=argmaxj(qj(x))
其中,所述预定的挑选规则为:将所述新的后验概率集合中的后验概率值按照从大到小顺序进行排列的前3个后验概率值为qj(x)max,qj(x)max-1,qj(x)max-2,若 选择qj(x)max作为合适的后验概率值,否则选择qj(x)max-1作为合适的后验概率值,其中Qq为设定的后验概率权值,取值范围为[1.4,1.6]。
本优选实施例设置改进的局部线性嵌入方法,需要确定的参数比较少,只有邻域数k和输出维数d,大大减少了运算量,且可以学习出任意维数的低维流形,提高了识别速度;采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取,具有旋转、平移以及伸缩变换条件下不变的性质,而且能得到一个解析的全局最优解;在声学特征降维子模块12对声学特征数据进行降维处理的过程中,计算各样本数据点Xi的K个邻域点的权重之和,并将其考虑到低维重构的损失函数中,降低了噪声的影响和数据样本外点对降维的干扰,进一步提高了情感识别的精度;设置预定的多模态情感融合策略,并根据多模态情感融合策略生成用户情感识别结果,使识别结果更加可靠准确。
本应用场景设定后验概率权值为Qq=1.5,识别精度相对提高了15%。
应用场景4
参见图1、图2,本应用场景中的一个具体实施例一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
优选地,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
本优选实施例通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。
优选地,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
本优选实施例方便维修。
优选地,所述情感控制系统包括语音情感识别处理模块1、表情情感识别处理模块2、多模态情感融合识别处理模块3和控制模块4:
(1)语音情感识别处理模块1,用于获取用户的语音信号,并对语音信号进行处理,最终输出语音情感识别结果,其包括声学特征提取子模块11、声学特征降维子模块12和语音情感分类处理子模块13;所述声学特征提取子模块11用于提取声学特征数据;所述声学特征降维子模块12用于采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理;所述语音情感分类处理子模块13用于采用已训练好的支持向量机作为语音情感识别分类器,对降维后的声学特征数据进行情感识别并输出语音情感识别结果,支持向量机的核函数采用高斯核函数;
(2)表情情感识别处理模块2,用于获取用户的表情图像,并对表情图像特征进行处理,最终生成表情情感识别结果,其包括表情特征提取子模块21、表情特征降维子模块22和表情情感分类处理子模块23;所述表情特征提取子模块21用于采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取;所述表情特征降维子模块22用于采用所述改进的局部线性嵌入方法对所述表情特征数据进行降维处理,并采用形态学处理方法做滤波处理;所述表情情感分类处理子模块23用于采用已训练好的稀疏分类器作为表情情感识别分类器,对降维、滤波处理后的表情特征数据进行情感识别并输出表情情感识别结果;
(3)多模态情感融合识别处理模块3,用于基于所述语音情感识别结果和表情情感识别结果,根据预定的多模态情感融合策略生成用户情感识别结果;
(4)控制模块,用于根据所述用户情感识别结果,在验证用户身份的前提下控制智能电视系统执行相应的操作。
本优选实施例设置多模态情感融合识别处理模块3,基于所述语音情感识别结果和表情情感识别结果,增强了识别结果的可靠性。
优选地,所述用户情感识别结果包括高级别和低级别的褒义情感,中性情感以及高级别和低级别的贬义情感组成的5个级别情感类型。
所述在验证用户身份的前提下控制智能电视系统执行相应的操作,具体为:所述控制模块基于预先设置的语音特征数据库,匹配所述用户的语音信号的语音特征,从而进行用户身份验证,若验证通过,控制模块控制智能电视系统执行相应的操作。
所述采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理,包括:
(1)将提取的声学特征数据中的声学特征向量看成是高维空间中的样本数据点,设M维的N个样本数据点为Xi,Xi∈RM,i∈[1,N],类别号为Ci,嵌入输出的N个m维的降维数据点为Yi,Yi∈Rm,i∈[1,N],m≤M,且m值的范围为[2,20],对每个样本数据点Xi确定其邻域点的数目K,邻域点的距离公式为:
L ′ = 1 - e - L λ , C i = C j L + δ 1 m a x ( L ) + δ 2 m i n ( L ) , C i ≠ C j
式中,L′是结合样本数据点类别信息计算后的距离,L是忽略样本数据点类别信息的原始欧氏距离,参数λ用来防止L过快增长,max(L)表示最大欧氏距离,min(L)表示最小欧式距离,常数因子δ1、δ2(0≤δ1、δ2≤1),共同控制距离计算时样本数据点类别信息的结合数量程度;
(2)利用每个样本数据点Xi的邻域点计算出样本数据点的局部重建权值矩阵Wij,要求最小化下列损失函数:
s ( W ) = Σ i = 1 N | | X i - Σ j = 1 K W i j X j | | 2
式中,Wij为Xi与Xj之间的权值,且需满足对Xi的非邻域点,Wij=0;
(3)计算各样本数据点Xi的K个邻域点的权重之和:
Q i j = Σ j = 1 K Z i j
其中,
式中,Zij为各邻域点之间的加权矩阵,d(Xi,Xj)表示样本数据点间的Fisher投影距离,ξ为可调参数;
(4)利用该样本数据点的局部重建权值矩阵Wij以及其邻域点计算出该样本数据点的输出值,具体是将所有的样本数据点Xi映射嵌入到低维空间中,并使得低维重构的误差达到最小,要求最小化下列损失函数:
ω ( Y ) = Σ i = 1 N Q i j | | Y i - Σ X j ∈ Ω ( X i ) W i j Y j | | 2 = t r ( YMY T )
式中,需满足其中构建一个稀疏矩阵M=(I-W)T(I-W),通过求解这个稀疏矩阵的前m个最小的非零特征值所对应的特征向量作为样本数据点Xi的嵌入输出值。
所述自适应二维Gabor小波变换方法中的Gabor滤波器的核函数定义为:
Φ α , β = | | k α , β | | 2 σ 2 e - | | k α , β | | 2 | | z | | 2 2 σ 2 [ e ik α , β z - e - σ 2 2 ]
式中,α、β分别表示核函数的方向和频率大小,α、β按照按如下方法设置:当表情图像质量较好时,选取三个中心频率β={0,1,2}和六个方向α={0,1,…,5}组成的18个Gabor滤波器用于特征提取;当表情图像受到腐蚀、遮挡时,选取四个中心频率β={0,1…,3}和八个方向α={0,1,…,7}组成的32个Gabor滤波器用于特征提取;
σ表示采用高斯函数窗口的大小,用来决定滤波器的带宽,σ能够根据参数设置进行自适应调整:将表情图像分成v×v子块,根据每个子块特征数目选择σ,特征数目大的子块设定σ=π,特征数目少的子块设定σ=2π;
kα,β为小波矢量,其中,kβ分别表示Gabor滤波器在频率和方向空间的采样方式。
所述预定的多模态情感融合策略为:
设已经计算出一个测试样本x对于c类的分类情况下,采用n个分类器进行分类得到的后验概率集合为{pij(x),i=1,2,…,n,j=1,2,…,c},对n个分类器取得的后验概率按照方差规则集成得到一个新的后验概率集合{qj(x),j=1,2,…,c},从中按照预定的挑选规则挑选出合适的后验概率值所对应的类别作为要输出的用户情感识别结果;
对于j类测试样本,按照方差规则获得的新的后验概率qj(x)可表示为:
q j ( x ) = q j ′ ( x ) Σ j q j ′ ( x )
式中,
q j ′ ( x ) = 1 n Σ i = 1 n ( p i j ( x ) - 1 n Σ i = 1 n p i j ( x ) ) 2
对于j类测试样本,最终所获得的识别类别可表示为:
ρ(x)=argmaxj(qj(x))
其中,所述预定的挑选规则为:将所述新的后验概率集合中的后验概率值按照从大到小顺序进行排列的前3个后验概率值为qj(x)max,qj(x)max-1,qj(x)max-2,若 选择qj(x)max作为合适的后验概率值,否则选择qj(x)max-1作为合适的后验概率值,其中Qq为设定的后验概率权值,取值范围为[1.4,1.6]。
本优选实施例设置改进的局部线性嵌入方法,需要确定的参数比较少,只有邻域数k和输出维数d,大大减少了运算量,且可以学习出任意维数的低维流形,提高了识别速度;采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取,具有旋转、平移以及伸缩变换条件下不变的性质,而且能得到一个解析的全局最优解;在声学特征降维子模块12对声学特征数据进行降维处理的过程中,计算各样本数据点Xi的K个邻域点的权重之和,并将其考虑到低维重构的损失函数中,降低了噪声的影响和数据样本外点对降维的干扰,进一步提高了情感识别的精度;设置预定的多模态情感融合策略,并根据多模态情感融合策略生成用户情感识别结果,使识别结果更加可靠准确。
本应用场景设定后验概率权值为Qq=1.55,识别精度相对提高了10%。
应用场景5
参见图1、图2,本应用场景中的一个具体实施例一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
优选地,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
本优选实施例通过切换模块可以自如的在智能电视模式和智能手机模式之间进行切换,不需要重复安装应用程序,可为智能电视节省大量内存。
优选地,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
本优选实施例方便维修。
优选地,所述情感控制系统包括语音情感识别处理模块1、表情情感识别处理模块2、多模态情感融合识别处理模块3和控制模块4:
(1)语音情感识别处理模块1,用于获取用户的语音信号,并对语音信号进行处理,最终输出语音情感识别结果,其包括声学特征提取子模块11、声学特征降维子模块12和语音情感分类处理子模块13;所述声学特征提取子模块11用于提取声学特征数据;所述声学特征降维子模块12用于采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理;所述语音情感分类处理子模块13用于采用已训练好的支持向量机作为语音情感识别分类器,对降维后的声学特征数据进行情感识别并输出语音情感识别结果,支持向量机的核函数采用高斯核函数;
(2)表情情感识别处理模块2,用于获取用户的表情图像,并对表情图像特征进行处理,最终生成表情情感识别结果,其包括表情特征提取子模块21、表情特征降维子模块22和表情情感分类处理子模块23;所述表情特征提取子模块21用于采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取;所述表情特征降维子模块22用于采用所述改进的局部线性嵌入方法对所述表情特征数据进行降维处理,并采用形态学处理方法做滤波处理;所述表情情感分类处理子模块23用于采用已训练好的稀疏分类器作为表情情感识别分类器,对降维、滤波处理后的表情特征数据进行情感识别并输出表情情感识别结果;
(3)多模态情感融合识别处理模块3,用于基于所述语音情感识别结果和表情情感识别结果,根据预定的多模态情感融合策略生成用户情感识别结果;
(4)控制模块,用于根据所述用户情感识别结果,在验证用户身份的前提下控制智能电视系统执行相应的操作。
本优选实施例设置多模态情感融合识别处理模块3,基于所述语音情感识别结果和表情情感识别结果,增强了识别结果的可靠性。
优选地,所述用户情感识别结果包括高级别和低级别的褒义情感,中性情感以及高级别和低级别的贬义情感组成的5个级别情感类型。
所述在验证用户身份的前提下控制智能电视系统执行相应的操作,具体为:所述控制模块基于预先设置的语音特征数据库,匹配所述用户的语音信号的语音特征,从而进行用户身份验证,若验证通过,控制模块控制智能电视系统执行相应的操作。
所述采用改进的局部线性嵌入方法对所述声学特征数据进行降维处理,包括:
(1)将提取的声学特征数据中的声学特征向量看成是高维空间中的样本数据点,设M维的N个样本数据点为Xi,Xi∈RM,i∈[1,N],类别号为Ci,嵌入输出的N个m维的降维数据点为Yi,Yi∈Rm,i∈[1,N],m≤M,且m值的范围为[2,20],对每个样本数据点Xi确定其邻域点的数目K,邻域点的距离公式为:
L ′ = 1 - e - L λ , C i = C j L + δ 1 m a x ( L ) + δ 2 m i n ( L ) , C i ≠ C j
式中,L′是结合样本数据点类别信息计算后的距离,L是忽略样本数据点类别信息的原始欧氏距离,参数λ用来防止L过快增长,max(L)表示最大欧氏距离,min(L)表示最小欧式距离,常数因子δ1、δ2(0≤δ1、δ2≤1),共同控制距离计算时样本数据点类别信息的结合数量程度;
(2)利用每个样本数据点Wi的邻域点计算出样本数据点的局部重建权值矩阵Wij,要求最小化下列损失函数:
s ( W ) = Σ i = 1 N | | X i - Σ j = 1 K W i j X j | | 2
式中,Wij为Xi与Xj之间的权值,且需满足对Xi的非邻域点,Wij=0;
(3)计算各样本数据点Xi的K个邻域点的权重之和:
Q i j = Σ j = 1 K Z i j
其中,
式中,Zij为各邻域点之间的加权矩阵,d(Xi,Xj)表示样本数据点间的Fisher投影距离,ξ为可调参数;
(4)利用该样本数据点的局部重建权值矩阵Wij以及其邻域点计算出该样本数据点的输出值,具体是将所有的样本数据点Xi映射嵌入到低维空间中,并使得低维重构的误差达到最小,要求最小化下列损失函数:
ω ( Y ) = Σ i = 1 N Q i j | | Y i - Σ X j ∈ Ω ( X i ) W i j Y j | | 2 = t r ( YMY T )
式中,需满足其中构建一个稀疏矩阵M=(I-W)T(I-W),通过求解这个稀疏矩阵的前m个最小的非零特征值所对应的特征向量作为样本数据点Xi的嵌入输出值。
所述自适应二维Gabor小波变换方法中的Gabor滤波器的核函数定义为:
Φ α , β = | | k α , β | | 2 σ 2 e - | | k α , β | | 2 | | z | | 2 2 σ 2 [ e ik α , β z - e - σ 2 2 ]
式中,α、β分别表示核函数的方向和频率大小,α、β按照按如下方法设置:当表情图像质量较好时,选取三个中心频率β={0,1,2}和六个方向α={0,1,…,5}组成的18个Gabor滤波器用于特征提取;当表情图像受到腐蚀、遮挡时,选取四个中心频率β={0,1…,3}和八个方向α={0,1,…,7}组成的32个Gabor滤波器用于特征提取;
σ表示采用高斯函数窗口的大小,用来决定滤波器的带宽,σ能够根据参数设置进行自适应调整:将表情图像分成v×v子块,根据每个子块特征数目选择σ,特征数目大的子块设定σ=π,特征数目少的子块设定σ=2π;
kα,β为小波矢量,其中,kβ分别表示Gabor滤波器在频率和方向空间的采样方式。
所述预定的多模态情感融合策略为:
设已经计算出一个测试样本x对于c类的分类情况下,采用n个分类器进行分类得到的后验概率集合为{pij(x),i=1,2,…,n,j=1,2,…,c},对n个分类器取得的后验概率按照方差规则集成得到一个新的后验概率集合{qj(x),j=1,2,…,c},从中按照预定的挑选规则挑选出合适的后验概率值所对应的类别作为要输出的用户情感识别结果;
对于j类测试样本,按照方差规则获得的新的后验概率qj(x)可表示为:
q j ( x ) = q j ′ ( x ) Σ j q j ′ ( x )
式中,
q j ′ ( x ) = 1 n Σ i = 1 n ( p i j ( x ) - 1 n Σ i = 1 n p i j ( x ) ) 2
对于j类测试样本,最终所获得的识别类别可表示为:
ρ(x)=argmaxj(qj(x))
其中,所述预定的挑选规则为:将所述新的后验概率集合中的后验概率值按照从大到小顺序进行排列的前3个后验概率值为qj(x)max,qj(x)max-1,qj(x)max-2,若 选择qj(x)max作为合适的后验概率值,否则选择qj(x)max-1作为合适的后验概率值,其中Qq为设定的后验概率权值,取值范围为[1.4,1.6]。
本优选实施例设置改进的局部线性嵌入方法,需要确定的参数比较少,只有邻域数k和输出维数d,大大减少了运算量,且可以学习出任意维数的低维流形,提高了识别速度;采用自适应二维Gabor小波变换方法对表情图像中的表情特征进行提取,具有旋转、平移以及伸缩变换条件下不变的性质,而且能得到一个解析的全局最优解;在声学特征降维子模块12对声学特征数据进行降维处理的过程中,计算各样本数据点Xi的K个邻域点的权重之和,并将其考虑到低维重构的损失函数中,降低了噪声的影响和数据样本外点对降维的干扰,进一步提高了情感识别的精度;设置预定的多模态情感融合策略,并根据多模态情感融合策略生成用户情感识别结果,使识别结果更加可靠准确。
本应用场景设定后验概率权值为Qq=1.6,识别精度相对提高了8%。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (3)

1.一种交互性能良好的智能电视系统,其特征是,包括智能电视系统和与智能电视系统相连的情感控制系统,所述智能电视系统包括智能电视,所述智能电视外部设有插槽,插槽内设有能够与智能手机相连的接口模块,所述智能电视设有切换模块,接口模块与切换模块相连,智能手机通过接口模块与智能电视相连或分离,然后通过切换模块实现智能电视和智能手机之间的动态切换,智能手机插入插槽内时,智能电视系统切换至智能手机模式,并由智能电视的显示屏显示,智能手机拔出插槽时,智能电视系统切换至普通智能电视模式;
所述智能电视还设有调配模块,调配模块输入端与切换模块相连,调配模块输出端与智能电视处理器相连。
2.根据权利要求1所述的一种交互性能良好的智能电视系统,其特征是,所述智能电视设有选择模块,选择模块设置在接口模块和切换模块之间。
3.根据权利要求2所述的一种交互性能良好的智能电视系统,其特征是,所述智能电视设有交互模块,所述交互模块包括获取单元、识别单元、执行单元。
CN201610616485.6A 2016-07-30 2016-07-30 一种交互性能良好的智能电视系统 Pending CN106210820A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610616485.6A CN106210820A (zh) 2016-07-30 2016-07-30 一种交互性能良好的智能电视系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610616485.6A CN106210820A (zh) 2016-07-30 2016-07-30 一种交互性能良好的智能电视系统

Publications (1)

Publication Number Publication Date
CN106210820A true CN106210820A (zh) 2016-12-07

Family

ID=57498302

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610616485.6A Pending CN106210820A (zh) 2016-07-30 2016-07-30 一种交互性能良好的智能电视系统

Country Status (1)

Country Link
CN (1) CN106210820A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024521A (zh) * 2012-12-27 2013-04-03 深圳Tcl新技术有限公司 节目筛选方法、系统及具有该系统的电视
CN105392039A (zh) * 2015-12-09 2016-03-09 陈国铭 智能电视系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103024521A (zh) * 2012-12-27 2013-04-03 深圳Tcl新技术有限公司 节目筛选方法、系统及具有该系统的电视
CN105392039A (zh) * 2015-12-09 2016-03-09 陈国铭 智能电视系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陶华伟: "面向语音情感识别的 Gabor 分块局部二值模式特征", 《信号处理》 *

Similar Documents

Publication Publication Date Title
Zhang et al. Sparse codes auto-extractor for classification: A joint embedding and dictionary learning framework for representation
CN106019973A (zh) 一种具有情感识别功能的智能家居
WO2022042043A1 (zh) 机器学习模型的训练方法、装置和电子设备
CN107657239A (zh) 掌纹图像性别分类方法及装置、计算机装置及可读存储介质
Jiang et al. Blind image quality measurement by exploiting high-order statistics with deep dictionary encoding network
CN107507620A (zh) 一种语音播报声音设置方法、装置、移动终端及存储介质
CN110188708A (zh) 一种基于卷积神经网络的人脸表情识别方法
CN110162639A (zh) 识图知意的方法、装置、设备及存储介质
CN109815920A (zh) 基于卷积神经网络和对抗卷积神经网络的手势识别方法
Pandey et al. Improving facial emotion recognition systems using gradient and laplacian images
CN112036261A (zh) 手势识别方法、装置、存储介质、电子装置
CN113762138A (zh) 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN110245621A (zh) 人脸识别装置及图像处理方法、特征提取模型、存储介质
CN106054682A (zh) 一种带有控制系统的家庭影院
CN109948498A (zh) 一种基于3d卷积神经网络算法的动态手势识别方法
CN111108508B (zh) 脸部情感识别方法、智能装置和计算机可读存储介质
Garg et al. Facial expression recognition & classification using hybridization of ICA, GA, and neural network for human-computer interaction
CN115049814A (zh) 采用神经网络模型的护眼灯智能调节方法
CN115131194A (zh) 一种图像合成模型的确定方法和相关装置
CN109711324A (zh) 基于傅里叶变换和卷积神经网络的人体姿态识别方法
CN113053361A (zh) 语音识别方法、模型训练方法、装置、设备及介质
Liu et al. Dfdnet: Discriminant face descriptor network for facial age estimation
DE112018007850B4 (de) Spracherkennungssystem und betriebsverfahren eines spracherkennungssystems
CN106239533A (zh) 一种通过情感控制的机器人
CN106210820A (zh) 一种交互性能良好的智能电视系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20161207