CN105578235A - 一种播放控制方法及装置 - Google Patents

一种播放控制方法及装置 Download PDF

Info

Publication number
CN105578235A
CN105578235A CN201410526095.0A CN201410526095A CN105578235A CN 105578235 A CN105578235 A CN 105578235A CN 201410526095 A CN201410526095 A CN 201410526095A CN 105578235 A CN105578235 A CN 105578235A
Authority
CN
China
Prior art keywords
information
video
control information
play
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410526095.0A
Other languages
English (en)
Inventor
刘志杰
黄志堂
张彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Great Xiang Science And Technology Ltd
Original Assignee
Shanghai Great Xiang Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Great Xiang Science And Technology Ltd filed Critical Shanghai Great Xiang Science And Technology Ltd
Priority to CN201410526095.0A priority Critical patent/CN105578235A/zh
Publication of CN105578235A publication Critical patent/CN105578235A/zh
Pending legal-status Critical Current

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种播放控制方法,应用于一电子设备,包括:导入所述电子设备视频;针对所述导入的视频,输入播放控制信息;针对所述输入的播放控制信息,进行识别;根据所述识别结果的控制信号,执行相应的播放操作。相应的,本发明还公开了一种播放控制装置,应用于一电子设备。本发明可以提高电子产品,特别是可穿戴设备,视频等文件播放的可操作性,极大提高用户使用电子设备的舒适度和体验感。

Description

一种播放控制方法及装置
技术领域
本发明涉及多媒体数据处理技术领域,具体涉及一种播放控制方法及播放控制装置。
背景技术
体感控制,在于人们可以很直接地使用肢体动作,与周边的装置或环境互动,而无需使用任何复杂的控制设备,便可让人们身历其境地与内容做互动。举个例子,当你站在一台电视前方,假使有某个体感设备可以侦测你手部的动作,此时若是我们将手部分别向上、向下、向左及向右挥,用来控制电视台的快转、倒转、暂停以及终止等功能,便是一种很直接地以体感操控周边装置的例子,或是将此四个动作直接对应于游戏角色的反应,便可让人们得到身临其境的游戏体验。其他关于体感控制的应用还包括:3D虚拟现实、空间鼠标、游戏手柄、运动监测、健康医疗照护等,在未来都有很大的市场。拿着手柄在电视上打游戏,握着鼠标在电脑网络游戏中厮杀的的游戏方式可能要落伍了。一项新的游戏方式――体感游戏或许将会成为游戏用户的新“宠儿”,它可以不用任何控制器,用肢体动作就可以控制游戏里的玩家,可以让用户更真实的遨游在游戏的海洋中。并且,随着技术的进步,体感控制还可以用在商场的服装店,甚至用户可以在网上随意试穿自己喜欢的衣服。
语音控制,与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用,例如在翼卡车联网中,只需按一键通客服人员口述即可设置目的地直接导航,安全、便捷。
随着电子设备已经深入到人们的日常生化中,如电脑、电视机等设备作为家庭和个人的工作/生活用品,已经与人们的工作生活息息相关。使用电子设备进行视频等文件播放需要也是与日俱增。
特别是近年来出行可穿戴设备等新兴产品,由于其使用用户的差异,且使用习惯不同,针对可穿戴设备等产品的视频等文件播放方法提出更高的要求,以便提高使用者的沉浸等用户体验感。如何利用体感控制及语音识别技术,来提高用户播放体验效果,成为一个有待解决的问题。
发明内容
本发明提供一种播放控制方法及装置,利用体感及语音控制技术,用以解决现有技术中存在视频等文件播放操作不方便,用户体验感差等问题。
为了实现上述发明目的,本发明提供了一种播放控制方法,应用于一电子设备,包括:
导入所述电子设备视频;
针对所述导入的视频,输入播放控制信息;
针对所述输入的播放控制信息,进行识别;
根据所述识别结果的控制信号,执行相应的播放操作。
优选的,上述方法中,
在输入所述播放控制信息前,针对所述导入的视频进行智能筛选。
优选的,上述方法中,
所述智能筛选包括,通过所述视频的格式进行筛选;
所述视频的格式,进一步包括:2D格式和3D格式。
优选的,上述方法中,
所述播放控制信息包括,肢体控制信息和语音控制信息。
优选的,上述方法中,
所述的识别过程包括:
当输入的播放信息为肢体控制信息时,通过加速度传感器测量重力产生的加速度,进而识别出设备姿态调整后的方向,发出控制信号;
当输入的播放控制信息为语音控制信息时,语音识别引擎针对所述语音控制信息进行识别,进而根据识别结果,发出控制信号。
优选的,上述方法中,
所述语音控制信息,是指预先设定的语音信息;
所述肢体控制信息,是指预先设定的肢体信息。
优选的,上述方法中,
所述预先设定的语音信息,进一步包括:开门、帮助、返回、播放、音量加、音量减、亮度加、亮度减、暂停、快进、快退、重播和停止。
所述预先设定的肢体信息,进一步包括:抬头、点头、左摆头和右摆头。
相应的,本发明还提供了一种播放控制装置,应用于一电子设备,包括:
信息搜索模块,用于搜集及导入电子设备视频信息;
信息接收模块,用于接收所述输入的播放控制信息;
信息识别模块,用于识别所述输入的播放控制信息;
信息执行模块,用于执行所述输入的播放控制信息。
优选的,上述的播放装置中,
所述信息识别模块包括:
肢体信息分析单元,用于加速度传感器测量重力产生的加速度,进而识别出设备姿态调整后的方向,发出控制信号;
语音信息分析单元,用于语音识别引擎针对所述语音控制信息进行识别,进而根据识别结果,发出控制信号。
与现有技术相比,本发明有益效果如下:
通过使用本发明所提供的播放控制方法及系统,可以极大提高电子产品,特别是可穿戴设备,视频等文件播放的可操作性,极大提高用户使用电子设备的舒适度和体验感。
附图说明
图1为本发明实施例所述的播放控制方法的流程示意图;
图2为本发明实施例所述的播放控制装置的结构示意图。
具体实施方式
本发明实施例所述的电子设备可以是头戴式显示器、手机、计算机、PDA等各种电子设备。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有创造性劳动下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例所述的播放控制方法,应用于一电子设备。该电子设备优选为手机和头戴显示器,当然还可以是计算机、PDA等各种设备。如图1所示,所述播放控制方法包括以下步骤:
步骤11,导入所述电子设备视频;
步骤12,针对所述导入的视频,输入播放控制信息;
步骤13,针对所述输入的播放控制信息,进行识别;
步骤14,根据所述识别结果的控制信号,执行相应的播放操作。
以上步骤11中,导入所述电子设备视频,是指在启动该播放控制方法时,可以自动检索、收集电子设备内所有视频文件,并将所有视频文件导入执行该播放控制方法的播放器中;
本步骤中,在将电子设备所有的视频文件导入该播放软件后,可以进一步对所有导入的视频文件进行智能筛选,包括以视频格式2D和3D等格式为标准进行筛选分类等。用户可以根据智能筛选分类结果,通过删除、禁用和选择确认等方式编辑已分类视频,提高用户视频播放操作的便捷性。
以上步骤12中,针对导入的视频,输入播放控制信息,是指在导入目标视频后,可以通过体感或肢体控制技术和语音识别控制技术,输入播放控制信息;所述输入的播放控制信息可以包括:肢体控制信息和语音控制信息。
在详细阐述本实施例后续步骤之前,针对本实施例所述的体感或肢体控制及语音识别控制技术,先行说明下:
以手机电子设备为例,肢体控制开启可以为:打开播放器默认进入视频选择列表,将手机放入可穿戴式设备中。手机上的距离传感器被遮挡后,会发出距离值变化的信号,播放器判断到距离传感器的值低于阀值后,打开肢体控制模式;所述的阀值可以是预先设定值,一般情况下最佳阀值为0。
肢体控制所实现的功能,包括向左侧头摆选片、向右侧摆头选片、点头播放、抬头取消选择等。
显然,本领域普通技术人员,无需通过创造性劳动就可以理解,除手机之外,PDA、头戴显示器等其他电子设备,可以通过同样的技术方式,开启肢体控制模式。
语音识别控制技术,是指麦克风捕捉到的语音模拟信号,经过模数转换、滤波、放大、纠错编码等处理步骤后生成PCM(PulseCodeModulation,脉码调制录音)数据。应用程序将PCM数据输入到语音识别引擎,引擎基于传统的隐马尔可夫模型和深度神经网络学习技术,将输入的语音,转成成对应的文字,完成整个识别过程。
在本发明实施例中,语音识别控制技术可以实现功能包括:
呼叫“开门”可进入语音操作模式;
呼叫“帮助”可查看语音指令列表;
呼叫“返回”或“播放”退出帮助;
呼叫“音量加(减)”可调节视频播放音量;
呼叫“亮度加(减)”可调节手机亮度;
呼叫“暂停”,暂停播放视频;
呼叫“播放”,继续播放视频;
呼叫“重播”,当前视频重新开始播放;
呼叫“快进(退)”,可快进(退)视频;
呼叫“停止”或“返回”,可退出视频播放;
以上说明内容仅是举例,并非穷尽。
本实施例所述的体感或肢体控制及语音识别控制技术可以通过播放场景互为切换,肢体控制模式可以为语音控制模式的入口,例如:用户可以通过肢体控制模式在无任何手部和外设辅助的情况下,仅通过肢体摆头行为即可实现影视内容的选取和确认播放,在进入影片的播放后再通过点头的肢体行为呼出语音菜单,此时语音控制模式被激活,用户可以使用语音指令对播放行为进行各种控制。
以上步骤13中,针对所述输入的播放控制信息,进行识别;
所述的识别过程进一步包括:
当输入的播放信息为肢体控制信息时,通过加速度传感器测量重力产生的加速度,进而识别出设备姿态调整后的方向,发出控制信号;
当输入的播放控制信息为语音控制信息时,语音识别引擎针对所述语音控制信息进行识别,进而根据识别结果,发出控制信号。
以下分别详细举例说明肢体控制信息识别和语言控制信息识别过程。
肢体控制信息识别。
向左侧摆头选片:用户向左侧摆头,加速度传感器判断出重力方向后,用3个向量值标示重力在X,Y,Z轴的加速度值,分别标示X,Y,Z轴的重力大小;当检测到Y轴加速度产生较大数值,可以是绝对值大于2,则确认手机两端产生了倾斜;播放器通过Y加速度值和手机放置方向,判断出手机姿态为向左侧时,视频播放器的信息识别模块发出“向左选片”控制信号,播放软件根据上述控制信号执行相应操作;即视频列表往左滚动一个视频。例如:手机屏是右转方式,此时检测到Y加速度值大于2,则确认手机相对人向左下坠,此时认为用户是向左侧选片。
向右侧摆头选片:用户向右侧摆头,加速度传感器判断出重力方向后,用3个向量值标示重力在X,Y,Z轴的加速度值,分别标示X,Y,Z轴的重力大小。当检测到Y轴加速度产生较大数值,可以是绝对值大于2,则确认手机两端产生了倾斜。播放器通过Y加速度值和手机放置方向,判断出手机姿态为向右侧时,视频播放器的信息识别模块发出“向右选片”控制信号,播放软件根据上述控制信号执行相应操作;即视频列表往右滚动一个视频。例如:手机屏是左转方式,此时检测到Y加速度值大于2,则确认手机相对人向右下坠,此时认为用户是向右侧选片。
点头播放:用户在视频选择列表中向下点头,陀螺仪传感器在Y轴检测到较大的角加速度值,当该值超过2.5时,可以确认用户做出了点头动作;视频播放器的信息识别模块发出“播放”控制信号,播放软件根据上述控制信号执行相应操作;即视频选择列表中的当前视频会被选中并播放。
抬头取消:用户在视频选择列表选中某个视频时,会出现一定时间的动画,时间可以预先设定,一般为5秒钟;在动画尚未消失时,用户向上抬头,陀螺仪传感器在Y轴检测到较大的角加速度值,当角速度值小于-2.5时,可以确定用户做出抬头动作;视频播放器的信息识别模块发出“取消”控制信号,播放软件根据上述控制信号执行相应操作;即停止动画并取消视频的选择。
语音控制信息识别。
暂停功能:视频播放过程中,快速抬头,可穿戴设备上的陀螺仪传感器将会测量到抬头动作的角加速度值,当角加速度值达到预设的门限值后,开启语音识别模式,所述门限值一般最佳的为2.5;在语音识别模式下对着麦克风说“暂停”。进而将麦克风捕捉到的语音信号送到语音识别引擎做识别,语音识别引擎识别到“暂停”后,视频播放器的信息识别模块发出“暂停”控制信号,播放软件根据上述控制信号执行相应操作。
播放功能:播放器处于暂停状态,快速抬头,可穿戴设备上的陀螺仪传感器将会测量到抬头动作的角加速度值,当角加速度值达到预设的门限值后,开启语音识别模式,所述门限值一般最佳的为2.5;开启语音识别模式,在语音识别模式下对着麦克风说“播放”。进而将麦克风捕捉到的语音信号送到语音识别引擎做识别,语音识别引擎识别到“播放”后,视频播放器的信息识别模块发出“播放”控制信号,播放软件根据上述控制信号执行相应操作。
快进功能:视频播放过程中,快速抬头,可穿戴设备上的陀螺仪传感器将会测量到抬头动作的角加速度值,当角加速度值达到预设的门限值后,开启语音识别模式,所述门限值一般最佳的为2.5;开启语音识别模式,在语音识别模式下对着麦克风说“快进”。进而将麦克风捕捉到的语音信号送到语音识别引擎做识别,语音识别引擎识别到“快进”后,视频播放器的信息识别模块发出“播放”控制信号,播放软件根据上述控制信号执行相应操作。
快退、音量加或减、亮度加或减、帮助和返回等功能,本领域普通技术人员,无须通过创造性劳动就能直接得出,其技术实现方案与上述实施例中“暂停、播放和快进功能”实现技术原理相同,在此不做赘述。
以上步骤14中,根据所述识别结果的控制信号,执行相应的播放操作。
播放器中的信息执行模块,收到播放器信息识别模块所发出控制信号后,按照控制信号要求执行相应操作。例如,控制信号要求为“暂停”,则信息执行模块执行“暂停”功能,播放器暂停;控制信号要求为“播放”,则信息执行模块执行“播放”功能,播放器播放;控制信号要求为“快进”,则信息执行模块执行“快进”功能,播放器快进。
本发明实施例,还提供了一种播放控制装置,应用于一电子设备,如图2所示,该装置包括:
信息搜索模块,用于搜集及导入电子设备视频信息;
信息接收模块,用于接收所述输入的播放控制信息;
信息识别模块,用于识别所述输入的播放控制信息;
信息执行模块,用于执行所述输入的播放控制信息。
其中,所述信息识别模块包括:
肢体信息分析单元,用于加速度传感器测量重力产生的加速度,进而识别出设备姿态调整后的方向,发出控制信号;
语音信息分析单元,用于语音识别引擎针对所述语音控制信息进行识别,进而根据识别结果,发出控制信号。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (9)

1.一种播放控制方法,应用于一电子设备,其特征在于,包括:
导入所述电子设备视频;
针对所述导入的视频,输入播放控制信息;
针对所述输入的播放控制信息,进行识别;
根据所述识别结果的控制信号,执行相应的播放操作。
2.如权利要求1所述的方法,其特征在于,
在输入所述播放控制信息前,针对所述导入的视频进行智能筛选。
3.如权利要求2所述的方法,其特征在于,
所述智能筛选包括,通过所述视频的格式进行筛选;
所述视频的格式,进一步包括:2D格式和3D格式。
4.根据权利要求1所述的方法,其特征在于,
所述播放控制信息包括,肢体控制信息和语音控制信息。
5.根据权利要求1或4所述的方法,其特征在于,
所述的识别过程包括:
当输入的播放信息为肢体控制信息时,通过加速度传感器测量重力产生的加速度,进而识别出设备姿态调整后的方向,发出控制信号;
当输入的播放控制信息为语音控制信息时,语音识别引擎针对所述语音控制信息进行识别,进而根据识别结果,发出控制信号。
6.根据权利要求5所述的方法,其特征在于,
所述语音控制信息,是指预先设定的语音信息;
所述肢体控制信息,是指预先设定的肢体信息。
7.根据权利要求5所述的方法,其特征在于,
所述预先设定的语音信息,进一步包括:开门、帮助、返回、播放、音量加、音量减、亮度加、亮度减、暂停、快进、快退、重播和停止;
所述预先设定的肢体信息,进一步包括:抬头、点头、左摆头和右摆头。
8.一种播放控制装置,应用于一电子设备,其特征在于,包括:
信息搜索模块,用于搜集及导入电子设备视频信息;
信息接收模块,用于接收所述输入的播放控制信息;
信息识别模块,用于识别所述输入的播放控制信息;
信息执行模块,用于执行所述输入的播放控制信息。
9.权利要求8所述的装置,其特征在于,
所述信息识别模块包括:
肢体信息分析单元,用于加速度传感器测量重力产生的加速度,进而识别出设备姿态调整后的方向,发出控制信号;
语音信息分析单元,用于语音识别引擎针对所述语音控制信息进行识别,进而根据识别结果,发出控制信号。
CN201410526095.0A 2014-10-09 2014-10-09 一种播放控制方法及装置 Pending CN105578235A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410526095.0A CN105578235A (zh) 2014-10-09 2014-10-09 一种播放控制方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410526095.0A CN105578235A (zh) 2014-10-09 2014-10-09 一种播放控制方法及装置

Publications (1)

Publication Number Publication Date
CN105578235A true CN105578235A (zh) 2016-05-11

Family

ID=55887828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410526095.0A Pending CN105578235A (zh) 2014-10-09 2014-10-09 一种播放控制方法及装置

Country Status (1)

Country Link
CN (1) CN105578235A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106200899A (zh) * 2016-06-24 2016-12-07 北京奇思信息技术有限公司 根据用户头部动作控制虚拟现实交互的方法及系统
CN112383827A (zh) * 2020-11-10 2021-02-19 北京乐学帮网络技术有限公司 一种视频播放控制方法及装置
CN114374878A (zh) * 2021-12-28 2022-04-19 苏州金螳螂文化发展股份有限公司 一种基于动作识别的交互展示系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106200899A (zh) * 2016-06-24 2016-12-07 北京奇思信息技术有限公司 根据用户头部动作控制虚拟现实交互的方法及系统
CN112383827A (zh) * 2020-11-10 2021-02-19 北京乐学帮网络技术有限公司 一种视频播放控制方法及装置
CN112383827B (zh) * 2020-11-10 2023-03-31 北京乐学帮网络技术有限公司 一种视频播放控制方法及装置
CN114374878A (zh) * 2021-12-28 2022-04-19 苏州金螳螂文化发展股份有限公司 一种基于动作识别的交互展示系统

Similar Documents

Publication Publication Date Title
US11030788B2 (en) Virtual reality presentation of body postures of avatars
CN105204642B (zh) 虚拟现实交互画面的调节方法和装置
JP6902683B2 (ja) 仮想ロボットのインタラクション方法、装置、記憶媒体及び電子機器
CN104049721B (zh) 信息处理方法及电子设备
CN102789313B (zh) 一种用户交互系统和方法
CN106445184B (zh) 虚拟计算机键盘
CN104252226B (zh) 一种信息处理的方法及电子设备
EP3696648A1 (en) Interaction method and device
US9089783B2 (en) System and method for a toy to interact with a computing device through wireless transmissions
CN109521927A (zh) 机器人互动方法和设备
CN102193627A (zh) 信息处理装置和方法、以及程序
US20160074751A1 (en) Visual effects for interactive computer games on mobile devices
CN106033255B (zh) 一种信息处理方法及电子设备
CN108475507A (zh) 信息处理设备、信息处理方法和程序
KR20190122559A (ko) 증강 또는 가상 현실 환경들에 대한 동적 햅틱 재생을 제공하기 위한 시스템들 및 방법들
US20130346085A1 (en) Mouth click sound based computer-human interaction method, system and apparatus
CN102779398A (zh) 一种智能家电的控制方法、装置及系统
CN107358953A (zh) 语音控制方法、移动终端及存储介质
CN106873869A (zh) 一种音乐播放的控制方法及装置
US20220269335A1 (en) Method and apparatus for dynamic human-computer interaction
CN108073572A (zh) 信息处理方法及其装置、同声翻译系统
CN105578235A (zh) 一种播放控制方法及装置
CN107015743A (zh) 一种悬浮按键控制方法及终端
JP2016087402A (ja) ユーザーとの相互作用が可能な玩具およびその玩具のユーザーとの相互作用方法
CN108681398A (zh) 基于虚拟人的视觉交互方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160511

WD01 Invention patent application deemed withdrawn after publication