CN103970892B - 基于智能家居设备的多维度观影系统控制方法 - Google Patents

基于智能家居设备的多维度观影系统控制方法 Download PDF

Info

Publication number
CN103970892B
CN103970892B CN201410223724.2A CN201410223724A CN103970892B CN 103970892 B CN103970892 B CN 103970892B CN 201410223724 A CN201410223724 A CN 201410223724A CN 103970892 B CN103970892 B CN 103970892B
Authority
CN
China
Prior art keywords
prime
content
home device
intelligent home
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410223724.2A
Other languages
English (en)
Other versions
CN103970892A (zh
Inventor
孙雨新
杨磊
刘云浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUXI QINGHUA INFORMATION SCIENCE AND TECHNOLOGY NATIONAL LABORATORY INTERNET OF THINGS TECHNOLOGY CENTER
Original Assignee
WUXI QINGHUA INFORMATION SCIENCE AND TECHNOLOGY NATIONAL LABORATORY INTERNET OF THINGS TECHNOLOGY CENTER
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI QINGHUA INFORMATION SCIENCE AND TECHNOLOGY NATIONAL LABORATORY INTERNET OF THINGS TECHNOLOGY CENTER filed Critical WUXI QINGHUA INFORMATION SCIENCE AND TECHNOLOGY NATIONAL LABORATORY INTERNET OF THINGS TECHNOLOGY CENTER
Priority to CN201410223724.2A priority Critical patent/CN103970892B/zh
Publication of CN103970892A publication Critical patent/CN103970892A/zh
Application granted granted Critical
Publication of CN103970892B publication Critical patent/CN103970892B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/172Processing image signals image signals comprising non-image signal components, e.g. headers or format information
    • H04N13/183On-screen display [OSD] information, e.g. subtitles or menus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals

Abstract

本发明提供一种基于智能家居设备的多维度观影系统控制方法,对任意给定的视频进行分析,包括图像信息、音频信息、字幕文字信息;对分析的结果进行整合,获得视频内容,以及视频内容随时间的变化;利用内容与感官间的映射关系,形成随视频变化的感官变化脚本,脚本内容包括温度感觉、湿度感觉、移动感、味觉、增强视觉、触觉;根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受。本发明具有分析准确性高、利用智能家居设备因而成本低廉、实时性强等优点。

Description

基于智能家居设备的多维度观影系统控制方法
技术领域
本发明属于多媒体技术与智能家居领域,尤其是一种基于智能家居设备的多维度观影系统控制方法。
背景技术
多维电影是在2D或者3D电影播放的基础上,伴随一些物理特效的电影形式。它能够通过给予观众视听感受以外的感受来提升观影体验,让观众可以在观影同时感受到与电影中人物一样的环境变化。虽然多维电影已经经历了20年的发展,但由于高昂的造价,它依旧只能在大型商场或者游乐场部署。另外,制作多维电影需要产生控制设备的脚本,从而实现对设备的控制命令的发出,而这需要大量人工操作。所以,以上这两点严重的阻碍了多维电影在群众中的普及。
随着物联网技术的发展,截至2013年,已经有12亿的智能家居设备部署在了8亿家庭中。在如此多的智能家居设备普及的环境下,智能家居设备可以帮助用户做很多事情。比如洗衣机和冰箱可以自动运行;空调可以自动调节室内温度;安放摄像头可以识别访客;以及一个集中式的控制路由可以负责这些设备的人工控制。智能家居环境为在家庭中建立一套多维电影院提供了机会,家庭不单单会使我们的栖身之所,还将成为娱乐的中心。
发明内容
本发明的目的在于克服现有技术中存在的不足,提供一种基于智能家居设备的多维度观影系统控制方法,用户无需购买专业多维影院设备,不需要专人进行控制脚本撰写工作,具有造价低廉,物理效果丰富,无人工干预产生脚本等优点。本发明采用的技术方案是:
一种基于智能家居设备的多维度观影系统控制方法,包括下述步骤:
S1.将影片视频以镜头为单位进行切分;
S2.对镜头内的图像、声音、字幕进行提取和分析,获得镜头内容,内容表示为关键词与对应置信度;
S3.对内容分析结果,即通过图像、声音、字幕获得的关键词-置信度对,使用投票的方式进行统计,得出分析内容的最终结果;
S4.将镜头分析得到的内容与建立的感受与物体的映射关系表进行匹配,获得当前镜头内给人的感受,从而形成感受随视频变化的脚本;
S5.根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受,并通过传感器反馈调节这一过程。
进一步地,所述步骤S1具体包括:从载入的视频的第二帧画面开始,逐帧比较它与前一帧间颜色直方图差异,如果差异值大于设定阈值λhsv,则判定当前帧与前一帧之间发生了镜头切换,这一时刻与上一次镜头切换发生时刻之间的视频片断为一个镜头,利用这种方法,将整个视频以单个镜头为单位进行切分。
进一步地,步骤S1中,颜色直方图的种类为HSV颜色直方图,颜色直方图的差异度用下面公式表示:
其中,
Hk(i)为第k帧的直方图,N为直方图箱子个数,N=a*b,a为亮度维度上采用的箱子个数,b为色调维度上采用的箱子个数。
进一步地,所述步骤S2具体包括:
S21.将镜头内中间时刻的图像帧提取出来,作为关键帧,利用图像分析算法对关键帧图片进行分析,并利用图像标注方法对画面内容进行标注;
S22.将镜头所对应时间段内的音频提取出来,通过变换得到音频特征,将这个特征与标准音频库中的声音进行匹配,如果匹配程度超过阈值λsound,则认为镜头内包含标准音频库中的声音;以此方式对声音内容进行标注;
S23.将镜头所对应时间段内的字幕以文本的形式提取出来,进行文本分析,获得字幕内容;
S24.将镜头内的关键帧与其前一帧进行光流分析,得到镜头拍摄时的移动方向,即得到以第一人称观看影片时的运动感受。
更进一步地,步骤S21中使用的图像分析算法为:
将训练图片集T的每一张图片划分为K个块,共|T|×K块,并利用k-means聚类算法,和hsv颜色特征和Garbor图像纹理特征对这些块进行聚类,设得到M个类别,ci∈{0,1}表示为第i个类别是否存在,则对每个图像I∈T,
有I={c1,c2,…,cM};
对于新输入的关键帧J,它包含类别ci的概率为:
其中P(ci|J)为在给定图片J的情况下,包含第i个分类的块的概率,#(ci,J)为J中第i个分类的块的个数,为所有包含第i个分类的图片个数,β为一个系统系数;当概率P(ci|J)大于一定阈值λImage时,认为这个图片J中包含类i,即包含类i所包含的关键词。
更进一步地,步骤S22具体包括:
S221,使用工具将镜头对应的音频提取出来;
S222,特征采用MFCC特征,提取MFCC特征的步骤为:将声音进行分段傅里叶变换,每段时间为Twindow;将傅里叶变换后的结果映射到梅尔音阶上;将每个梅尔音阶上的频率进行对数变换;对变换后的结果进行离散余弦变换;变换后的结果的系数即为MFCC特征;
S223,使用该段音频的MFCC特征与音频库中的音频MFCC特征利用DTW算法进行匹配,如果得到的相似度大于λsound=0.2,则认为包含对应音频的单词。
更进一步地,步骤S23具体包括:
建立一个包含若干单词的词库,并为库内单词标注上对应的感受,对镜头内的台词的文本作为输入,得出对应关键词;并包含以下步骤:
S231,对文本进行去标点和分词处理,得到单词列表;
S232,对每个单词进行取词根操作;
S233,对每个取过词根的单词在词库中寻找,是否有匹配的词目,如果有则表示字幕中存在这个词目,如果没有,则表示不存在。
进一步地,步骤S3中采用投票方式对视频内容进行决策,图像、声音、字幕三种信息提供的内容均用关键词-置信度的二元对表示,设关键词集合为KW,图像内容分析结果可以表示为:
其中为图像内容中对第i个关键词的置信度,n为关键词的总数即n=|KW|;同理可以得出声音的内容标注结果:
和字幕的内容标注结果:
分别表示声音内容中和字幕内容中对第i个关键词的置信度;
对内容的投票结果为
其中如果大于阈值λc=0.5,则认为存在该词。
进一步地,步骤S4中的感受与物体映射关系表的内容为:
物体→温度感受,湿度感受,运动感受,味觉,增强视觉,触觉;
步骤S4中,对不同词汇进行分析得到的感受可能存在冲突,采用投票的方式对这些感受进行冲突消除,#(感受名称)表示某种感受名称在此次标注中出现的次数,S(感受名称)表示某种感受最后的投票结果,以百分比形式表示;
……
选择投票结果最高的感受作为最终感受的结果。m表示某种感受的第m种感受结果。
进一步地,步骤S5中,智能家居设备包括能够产生温感、湿感、运动感、嗅觉、触觉和增强视觉的设备中的一种或多种;
对智能家居设备的调控包括两种方式:1)即时控制、2)延迟控制;对于延迟控制,采用预测方法对相应智能家具设备的调控效果进行预测,并根据预测流程选择最合适的调控步骤。
本发明的优点在于:利用本发明提出的多维度观影系统控制方法,结合对智能家居设备的控制,能够产生多维影院的效果,使得多维影院的普及变得简单方便,还节约了成本,并且控制过程自动进行,无需人工干预产生脚本。
附图说明
图1为本发明的流程示意图。
图2为本发明的家庭多维影院示意图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
本发明提供的基于智能家居设备的多维度观影系统控制方法,包括以下步骤,如图1所示:
S1,将影片视频载入至内存中,从第二帧画面开始,逐帧比较它与前一帧间颜色直方图差异,如果差异值大于设定阈值λhsv,则判定当前帧与前一帧之间发生了镜头切换,即两帧分属不同镜头中,这一时刻与上一次镜头切换发生时刻之间的视频片断为一个镜头。利用这种方法,将整个视频以单个镜头为单位进行切分。
优选的,S1中颜色直方图的种类为HSV颜色直方图,并在亮度维度上采用a=32个箱子、在色调维度上采用b=30个箱子;
颜色直方图的差异度用下面公式表示:
其中,
Hk(i)为第k帧的直方图,N为直方图箱子个数,在此系统中为a*b=32*30=960个;
如果这个差异度大于阈值λhsv=0.1,则认定为一次镜头切换发生。
S2.对镜头内的图像、声音、字幕进行提取和分析,获得镜头内容,内容表示为关键词与对应置信度;S2具体包括以下步骤S21、S22、S23、S24:
S21.将镜头内中间时刻的图像帧提取出来,作为关键帧,利用图像分析算法对关键帧图片进行分析,并利用图像标注方法对画面内容进行标注;分析图片时,分析图片中包含的物体和环境,包含关键词如:森林、水流、太阳等。
此处所使用的图像分析算法的过程为:
将训练图片集T的每一张图片划分为K个块,共|T|×K块,并利用k-means聚类算法,和hsv颜色特征和Garbor图像纹理特征对这些块进行聚类,设得到M个类别,ci∈{0,1}表示为第i个类别是否存在,则对每个图像I∈T,
有I={c1,c2,…,cM};
对于新输入的关键帧J,它包含类别ci的概率为:
其中P(ci|J)为在给定图片J的情况下,包含第i个分类的块的概率,#(ci,J)为J中第i个分类的块的个数,为所有包含第i个分类的图片个数,β为一个系统系数;当概率P(ci|J)大于一定阈值λImage时,认为这个图片J中包含类i,即包含类i所包含的关键词。
优选的,S21中,K=500,β=0.2,λImage=70%。
S22.将镜头所对应时间段内的音频提取出来,通过变换得到音频特征,将这个特征与标准音频库中的声音进行匹配,如果匹配程度超过阈值λsound,则认为镜头内包含标准音频库中的声音,即包含对应的发声物体;
特别的,S22中进行音频分析分为以下步骤:
S221,工具使用FFMPEG将镜头对应的音频提取出来;
S222,特征采用MFCC特征,提取MFCC特征的步骤为:将声音进行分段傅里叶变换,每段时间为Twindow;将傅里叶变换后的结果映射到梅尔音阶上;将每个梅尔音阶上的频率进行对数变换;对变换后的结果进行离散余弦变换;变换后的结果的系数即为MFCC特征;
S223,使用该段音频的MFCC特征与音频库中的音频MFCC特征利用DTW算法进行匹配,如果得到的相似度大于λsound=0.2,则认为包含对应音频的单词;以此方式对声音内容进行标注;
S23.将镜头所对应时间段内的字幕以文本的形式提取出来,进行文本分析,获得字幕内容;
优选的,S23中字幕分析方法使用关键词匹配算法,需要准备一个包含很多单词的词库,并为他们标注上对应的感受,如表1所示,对镜头内的台词的文本作为输入,得出对应关键词;
特别的,S23中包含以下步骤:
S231,对文本进行去标点和分词处理,得到单词列表;
S232,对每个单词进行取词根操作,如人们→人;
S233,对每个取过词根的单词在词库中寻找,是否有匹配的词目,如果有则表示字幕中存在这个词目,如果没有,则表示不存在;
表1
S24.将镜头内的关键帧与其前一帧进行光流分析,得到镜头拍摄时的移动方向,即得到以第一人称观看电影时的运动感受。如果镜头向左(右)移动,则认为这时应该产生左侧的风,来表达观众和镜头一起移动;如果镜头向前移动,则应该产生前向的风,来表达观众与镜头一起向前,比如车辆向前行驶时总会产生前向风。
S3.对内容分析结果,即通过图像、声音、字幕获得的关键词-置信度对,使用投票的方式进行统计,得出分析内容的最终结果;
优选的,S3中采用投票方式对视频内内容进行决策。图像、声音、字幕三种信息提供的内容均用关键词-置信度的二元对表示,设关键词集合为KW,图像内容分析结果可以表示为:
其中为图像内容中对第i个关键词的置信度,n为关键词的总数即n=|KW|;同理可以得出声音的内容标注结果:
和字幕的内容标注结果:
分别表示声音内容中和字幕内容中对第i个关键词的置信度;
对内容的投票结果为
其中如果大于阈值λc=0.5,则认为存在该词。
S4.将镜头分析得到的内容与建立的感受与物体的映射关系表进行匹配,获得当前镜头内给人的感受,感受内容包括温度感觉、湿度感觉、运动感觉、嗅觉、触觉和增强视觉,从而形成感受随视频变化的脚本;
特别的,S4中的感受与物体映射关系表由人工创建,表内容为:
物体→温度感受,湿度感受,运动感受,味觉,增强视觉,触觉;
表1中列出了部分单词所对应的感受,我们的系统中包含这些词汇,但不限于这些词汇,在包含更多的词汇的情况下将产生更好的分析效果;
优选的,在S4中对不同词汇进行分析得到的感受可能存在冲突,采用投票的方式对这些感受进行冲突消除,#(感受名称)表示某种感受名称在此次标注中出现的次数,S(感受名称)表示某种感受最后的投票结果,以百分比形式表示,以温度感受为例:
对于冷、热、常温间的冲突,我们选择投票结果最高的感受作为最终温度感受的结果。同理可以解决干燥、潮湿,喷水与否,闪光与否等的冲突。
S5.根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受,并通过传感器反馈调节这一过程;
特别的,S5中使用的智能家居设备并无限制,但能够产生温感、湿感、运动感、嗅觉、触觉和增强视觉,如果设备存在,则能够产生对应效果;如果不存在,或用其他设备代替,或不能产生对应感受
优选的,本发明使用一些常用家庭电器产生对应效果,如表2所示,摆放方式如图2所示,本发明中使用了但不限于表2中所列智能家居设备;
表2
智能家居设备 能够产生的物理效果
空调 温度感受-温度变化
加湿器 湿度感受-湿度变化
风扇 运动感受-不同风向的风
气味发生器(装有香精的加湿器) 嗅觉-气味变化
闪光灯 增强视觉-炫目闪光
背景彩灯 增强视觉-背景延展
喷雾器(或喷水器) 触觉-水喷在皮肤上的感觉
优选的,S5中对智能家居的调控分为两种方式:1)即时控制2)延迟控制。即时控制是指在指令发出之后能够直接改变室内环境,以表2中设备为例,风扇、闪光灯、气味发生器、喷水器、背景彩灯均属于即时控制;而空调、加湿器为延迟控制,因为湿度感受和温度感受不可能在空调工作变化之后立刻发生变化,而需要一段长时间。对于延迟控制,该发明采用预测方法对空调和加湿器的调控效果进行预测,并根据预测流程选择最合适的调控步骤,以温度控制为例,温度调节预测曲线为:
其中Theat(tj)为加热时,在已知初始温度为Ti时,tj时刻的温度,γh为升温速率,当达到最高温度时就维持恒定;Tcool(tj)为制冷时,在已知初始温度为Ti时,tj时刻的温度,γc为降温速率,当达到最低温度时就维持恒定;
本发明在选择调控方式时便利所有操作可能性(每隔τ=30s时间调节一次),选择能够使温度匹配程度最高的调控方式进行调节。
本发明在最后一步控制智能家居设备按照脚本内容对室内环境进行调节,并利用传感器对环境调节进行反馈,可以产生身临其境的效果,使得观众在家即可享受多维电影带来的美好享受。
本发明中涉及的一些术语解释如下:
MFCC:现有语音识别系统采用的最主要的两种语音特征是线性预测倒谱参数(Linear Prediction Cepstrum Coefficient,LPCC)和Mel频率倒谱系数(Mel FrequencyCepstrum Coefficient,MFCC)。Mel频率倒谱系数(Mel Frequency CepstrumCoefficient,MFCC),该特征考虑了人耳的听觉特性,将频谱转化为基于Mel频率的非线性频谱,然后转换到倒谱域上。由于充分模拟了人的听觉特性,而且没有任何前提假设,MFCC参数具有识别性能和抗噪能力,实验证明在语音识别中MFCC参数的性能明显优于LPCC参数。
HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(Hexcone Model)。这个模型中颜色的参数分别是:色调(H),饱和度(S),亮度(V)。
DTW算法:Dynamic Time Warping,动态时间归整算法。

Claims (8)

1.一种基于智能家居设备的多维度观影系统控制方法,其特征在于,包括下述步骤:
S1.将影片视频以镜头为单位进行切分;
S2.对镜头内的图像、声音、字幕进行提取和分析,获得镜头内容,内容表示为关键词与对应置信度;
S3.对内容分析结果,即通过图像、声音、字幕获得的关键词-置信度对,使用投票的方式进行统计,得出分析内容的最终结果;
S4.将镜头分析得到的内容与建立的感受与物体的映射关系表进行匹配,获得当前镜头内给人的感受,从而形成感受随视频变化的脚本;
S5.根据感觉随视频变化的脚本,通过智能家居设备产生与脚本同步的感受,并通过传感器反馈调节这一过程;
步骤S3中采用投票方式对视频内容进行决策,图像、声音、字幕三种信息提供的内容均用关键词-置信度的二元对表示,设关键词集合为KW,图像内容分析结果可以表示为:
R i m a g e = { c k 1 , c k 2 , ... , c k i , ... , c k n }
其中为图像内容中对第i个关键词的置信度,n为关键词的总数即n=|KW|;同理可以得出声音的内容标注结果:
R s o u n d = { c k 1 ′ , c k 2 ′ , ... , c k i ′ , ... , c k n ′ }
和字幕的内容标注结果:
R t e x t = { c k 1 ′ ′ , c k 2 ′ ′ , ... , c k i ′ ′ , ... , c k n ′ ′ }
分别表示声音内容中和字幕内容中对第i个关键词的置信度;
对内容的投票结果为
R = { c k 1 ′ ′ ′ , c k 2 ′ ′ ′ , ... , c k i ′ ′ ′ , ... , c k n ′ ′ ′ }
其中如果大于阈值λc=0.5,则认为存在该词;
步骤S4中的感受与物体映射关系表的内容为:
物体→温度感受,湿度感受,运动感受,味觉,增强视觉,触觉;
步骤S4中,对不同词汇进行分析得到的感受可能存在冲突,采用投票的方式对这些感受进行冲突消除,#(感受名称)表示某种感受名称在此次标注中出现的次数,S(感受名称)表示某种感受最后的投票结果,以百分比形式表示;
选择投票结果最高的感受作为最终感受的结果。
2.如权利要求1所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
所述步骤S1具体包括:从载入的视频的第二帧画面开始,逐帧比较它与前一帧间颜色直方图差异,如果差异值大于设定阈值λhsv,则判定当前帧与前一帧之间发生了镜头切换,这一时刻与上一次镜头切换发生时刻之间的视频片断为一个镜头,利用这种方法,将整个视频以单个镜头为单位进行切分。
3.如权利要求2所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
步骤S1中,颜色直方图的种类为HSV颜色直方图,颜色直方图的差异度用下面公式表示:
Σ i = 1 N ( H k ( i ) - H ‾ k ) ( H k + 1 ( i ) - H ‾ k + 1 ) Σ i = 1 N ( H k ( i ) - H ‾ k ) 2 Σ i = 1 N ( H k + 1 ( i ) - H ‾ k + 1 ) 2
其中,
H ‾ k = 1 N Σ i = 1 N H k ( i )
Hk(i)为第k帧的直方图,N为直方图箱子个数,N=a*b,a为亮度维度上采用的箱子个数,b为色调维度上采用的箱子个数。
4.如权利要求1所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
所述步骤S2具体包括:
S21.将镜头内中间时刻的图像帧提取出来,作为关键帧,利用图像分析算法对关键帧图片进行分析,并利用图像标注方法对画面内容进行标注;
S22.将镜头所对应时间段内的音频提取出来,通过变换得到音频特征,将这个特征与标准音频库中的声音进行匹配,如果匹配程度超过阈值λsound,则认为镜头内包含标准音频库中的声音;以此方式对声音内容进行标注;
S23.将镜头所对应时间段内的字幕以文本的形式提取出来,进行文本分析,获得字幕内容;
S24.将镜头内的关键帧与其前一帧进行光流分析,得到镜头拍摄时的移动方向,即得到以第一人称观看影片时的运动感受。
5.如权利要求4所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
步骤S21中使用的图像分析算法为:
将训练图片集T的每一张图片划分为K个块,共|T|×K块,并利用k-means聚类算法,和hsv颜色特征和Garbor图像纹理特征对这些块进行聚类,设得到M个类别,ci∈{0,1}表示为第i个类别是否存在,则对每个图像I∈T,
有I={c1,c2,…,cM};
对于新输入的关键帧J,它包含类别ci的概率为:
P ( c i | J ) = ( 1 - β ) # ( c i , J ) Σ k = 1 M # ( c k , J ) + β Σ k = 1 M # ( c i , J k ) M
其中P(ci|J)为在给定图片J的情况下,包含第i个分类的块的概率,#(ci,J)为J中第i个分类的块的个数,为所有包含第i个分类的图片个数,β为一个系统系数;当概率P(ci|J)大于一定阈值λImage时,认为这个图片J中包含类i,即包含类i所包含的关键词。
6.如权利要求4所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
步骤S22具体包括:
S221,使用工具将镜头对应的音频提取出来;
S222,特征采用MFCC特征,提取MFCC特征的步骤为:将声音进行分段傅里叶变换,每段时间为Twindow;将傅里叶变换后的结果映射到梅尔音阶上;将每个梅尔音阶上的频率进行对数变换;对变换后的结果进行离散余弦变换;变换后的结果的系数即为MFCC特征;
S223,使用该段音频的MFCC特征与音频库中的音频MFCC特征利用DTW算法进行匹配,如果得到的相似度大于λsound=0.2,则认为包含对应音频的单词。
7.如权利要求4所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
步骤S23具体包括:
建立一个包含若干单词的词库,并为库内单词标注上对应的感受,对镜头内的台词的文本作为输入,得出对应关键词;并包含以下步骤:
S231,对文本进行去标点和分词处理,得到单词列表;
S232,对每个单词进行取词根操作;
S233,对每个取过词根的单词在词库中寻找,是否有匹配的词目,如果有则表示字幕中存在这个词目,如果没有,则表示不存在。
8.如权利要求1所述的基于智能家居设备的多维度观影系统控制方法,其特征在于:
步骤S5中,智能家居设备包括能够产生温感、湿感、运动感、嗅觉、触觉和增强视觉的设备中的一种或多种;
对智能家居设备的调控包括两种方式:1)即时控制、2)延迟控制;对于延迟控制,采用预测方法对相应智能家具设备的调控效果进行预测,并根据预测流程选择最合适的调控步骤。
CN201410223724.2A 2014-05-23 2014-05-23 基于智能家居设备的多维度观影系统控制方法 Active CN103970892B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410223724.2A CN103970892B (zh) 2014-05-23 2014-05-23 基于智能家居设备的多维度观影系统控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410223724.2A CN103970892B (zh) 2014-05-23 2014-05-23 基于智能家居设备的多维度观影系统控制方法

Publications (2)

Publication Number Publication Date
CN103970892A CN103970892A (zh) 2014-08-06
CN103970892B true CN103970892B (zh) 2017-03-01

Family

ID=51240390

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410223724.2A Active CN103970892B (zh) 2014-05-23 2014-05-23 基于智能家居设备的多维度观影系统控制方法

Country Status (1)

Country Link
CN (1) CN103970892B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105988369B (zh) * 2015-02-13 2020-05-08 上海交通大学 一种内容驱动的智能家居控制方法
WO2016144591A1 (en) * 2015-03-11 2016-09-15 Siemens Industry, Inc. Diagnostics in building automation
CN105263044A (zh) * 2015-10-13 2016-01-20 小米科技有限责任公司 智能家居设备调整方法及装置
CN105760141B (zh) * 2016-04-05 2023-05-09 中兴通讯股份有限公司 一种实现多维控制的方法、智能终端及控制器
CN105955045A (zh) * 2016-05-31 2016-09-21 微鲸科技有限公司 智能观影场景实现系统和实现方法
CN107178870A (zh) * 2017-05-04 2017-09-19 珠海格力电器股份有限公司 多媒体数据播放设备、空调控制方法及装置
CN109754265B (zh) * 2017-11-01 2023-04-07 阿里巴巴集团控股有限公司 一种数据处理方法及装置
CN111209040A (zh) * 2020-01-09 2020-05-29 杭州涂鸦信息技术有限公司 一种基于傅里叶变换的Mesh音乐灯实现方法及系统
CN112488107A (zh) * 2020-12-04 2021-03-12 北京华录新媒信息技术有限公司 一种视频字幕的处理方法及处理装置
CN113590247B (zh) * 2021-07-21 2024-04-05 杭州阿里云飞天信息技术有限公司 文本创作方法及计算机程序产品

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873455A (zh) * 2010-04-29 2010-10-27 华南理工大学 智能变色电视背景墙及其变色控制方法
CN102436246A (zh) * 2011-12-19 2012-05-02 厦门万安智能股份有限公司 具有环境适应情景模式的智能家居集控装置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8850348B2 (en) * 2010-12-31 2014-09-30 Google Inc. Dynamic device-associated feedback indicative of responsible device usage
KR101801327B1 (ko) * 2011-07-29 2017-11-27 삼성전자주식회사 감정 정보 생성 장치, 감정 정보 생성 방법 및 감정 정보 기반 기능 추천 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101873455A (zh) * 2010-04-29 2010-10-27 华南理工大学 智能变色电视背景墙及其变色控制方法
CN102436246A (zh) * 2011-12-19 2012-05-02 厦门万安智能股份有限公司 具有环境适应情景模式的智能家居集控装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A neural network approach towards reinforcing smart home security;Chu Chong Teoh等;《8th Asia-Pacific Symposium on Information and Telecommunication Technologies》;20100618;第1-5页 *
Interactive multimedia mirror system design;Jun-Ren Ding等;《IEEE Transactions on Consumer Electronics》;20080930;第54卷(第3期);第972-980页 *
基于人体舒适度的家庭环境控制器的设计与实现;王秀娟;《中国优秀硕士学位论文全文数据库信息科技辑》;20130715;第I140-436页 *
情感化智能家居若干关键问题研究;邹腾跃;《万方数据知识服务平台》;20090921;全文 *

Also Published As

Publication number Publication date
CN103970892A (zh) 2014-08-06

Similar Documents

Publication Publication Date Title
CN103970892B (zh) 基于智能家居设备的多维度观影系统控制方法
JP7325668B2 (ja) シーンアウェア映像対話
CN107766447B (zh) 一种使用多层注意力网络机制解决视频问答的方法
CN105138991B (zh) 一种基于情感显著性特征融合的视频情感识别方法
US7274741B2 (en) Systems and methods for generating a comprehensive user attention model
CN108234870A (zh) 图像处理方法、装置、终端及存储介质
CN105989842B (zh) 对比声纹相似度的方法、装置及其在数字娱乐点播系统中的应用
CN106878820A (zh) 直播互动方法及装置
CN106205611B (zh) 一种基于多模态历史响应结果的人机交互方法及系统
CN104298722A (zh) 多媒体交互系统及其方法
CN104540275B (zh) 一种调节现场照明装置的方法、设备及系统
CN103279970A (zh) 一种实时的语音驱动人脸动画的方法
CN110047510A (zh) 音频识别方法、装置、计算机设备及存储介质
CN105588287B (zh) 智能音乐空调的控制方法及系统
CN107832747B (zh) 一种基于低秩字典学习算法的人脸识别方法
CN107507620A (zh) 一种语音播报声音设置方法、装置、移动终端及存储介质
CN108401186B (zh) 一种基于人脸识别的智能电视显示控制方法
CN111128103A (zh) 一种沉浸式ktv智能点唱系统
CN111442464B (zh) 空调器及其控制方法
CN105185384A (zh) 具有环境模拟功能的音控播放系统及控制方法
WO2020078076A1 (zh) 控制空调的方法及系统、空调器、家用电器
CN111554303B (zh) 一种歌曲演唱过程中的用户身份识别方法及存储介质
CN110708610B (zh) 一种线下直播互动系统及方法
CN106054682B (zh) 一种带有控制系统的家庭影院
Sasaki et al. Affective music recommendation system based on the mood of input video

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant