CN1797284A - 基于玩家姿势和语音的电子游戏场景和角色控制方法 - Google Patents

基于玩家姿势和语音的电子游戏场景和角色控制方法 Download PDF

Info

Publication number
CN1797284A
CN1797284A CN 200410101881 CN200410101881A CN1797284A CN 1797284 A CN1797284 A CN 1797284A CN 200410101881 CN200410101881 CN 200410101881 CN 200410101881 A CN200410101881 A CN 200410101881A CN 1797284 A CN1797284 A CN 1797284A
Authority
CN
China
Prior art keywords
control
voice
scene
game
posture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200410101881
Other languages
English (en)
Other versions
CN100345085C (zh
Inventor
王阳生
陈宇峰
曾祥永
鲁鹏
周晓旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CNB2004101018812A priority Critical patent/CN100345085C/zh
Publication of CN1797284A publication Critical patent/CN1797284A/zh
Application granted granted Critical
Publication of CN100345085C publication Critical patent/CN100345085C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

基于玩家姿势和语音的电子游戏场景和角色控制方法,包括:对从摄像头获得的图像进行简单有效的预处理;利用姿态特征等时空信息进行图像分割;通过时空相关性进行区域选择和特征提取;通过对多目标之间关系的分析识别,形成对游戏的控制指令;另一方面,通过麦克风和声卡获取语音命令;采用连续语音识别技术,识别特定的词汇;并将其转化为特定的游戏指令;最后将姿态识别得到的方向控制信号和语音识别的其它复杂控制命令相结合,发挥各自的长处,实现模拟游戏场景漫游的实时控制功能。

Description

基于玩家姿势和语音的电子游戏场景和角色控制方法
技术领域
本发明涉及图像分析与识别技术领域,特别是一种基于玩家姿势和语音的子游戏场景和角色控制方法。
背景技术
近年来,随着计算机技术的革新,以计算机游戏为代表的数字娱乐产业飞速发展。作为一类特殊的应用软件,计算机游戏通过向游戏用户提供一系列的菜单选项和操作指令,实现用户与游戏之间的交互操作。用于游戏的传统人机交互方式有:鼠标键盘、游戏杆及专用游戏设备等,以手动和有线连接为主。伴随计算机游戏种类与内容的不断扩展丰富,其操作复杂性剧增,仍然仅采用传统交互方式,越来越难于控制。游戏用户期望能以更自然、更智能的新方式进行交互操作,如采用自身语音、姿体动作等,由此可使游戏更具交互性和沉浸感。随着计算机视觉和语音识别技术的发展,应用视觉和语音技术进行自然的人机交互已经成为可能,由于摄像头、声卡及麦克风已经成为计算机常用的配置,这种技术的应用也就具有广阔的前景。
采用姿势与语音的游戏场景控制,就是用玩家的姿势和语音取代传统的键盘鼠标,仅通过摄像头拍摄玩家姿态及其运动状态,并通过麦克风录入玩家的语音命令,在计算机中进行分析和识别,并将结果转化为游戏的控制指令,实现对游戏中场景和人物的直接控制,以代替或辅助传统的游戏交互方式。由于游戏对实时性要求高,因此视频检测和语音识别方法必需实时、鲁棒。为便于用户使用,这种控制方法还必需易于实现和操作。
发明内容
本发明的目的在于提供一种基于玩家姿势和语音的电子游戏场景和角色控制方法。
本发明的另一个目的是提供一种实时鲁棒的电子游戏场景和角色控制方法,运用计算机视觉和语音识别技术对玩家姿态和语音进行识别,对通过摄像头和声卡设备捕获到的图像和语音进行处理,并实时地、鲁棒地检测出特定姿态的位置、方向以及语音的命令,转换为游戏指令。
为实现上述目的,基于玩家姿势和语音的电子游戏场景和角色控制方法步骤包括:
①通过摄像头设备,实时捕获图像并进行光线校正,去噪等预处理;
②利用人体姿态运动的时间和空间特征进行分割,将分割后的图像进行特征提取、分析,求得姿态特征点位置,方向及他们组成的基本形状参数;通过规则处理,将标志的位置状态,转化为游戏控制命令;
③同时将从声卡获得的声音,采用现有的语音识别技术进行模型匹配识别,并转化为相应的游戏控制命令;
④最后,通过游戏的控制接口驱动游戏,或者直接修改自行开发游戏的内部模型参数。
附图说明
图1是本发明的基于玩家姿势和语音的电子游戏场景和角色控制方法流程图。
图2是多通道游戏场景控制示意图。
图3是采用本方法的游戏控制示意图。
图4是视频和声音的识别结果,映射到相应的游戏控制中的流程图。
具体实施方式
基于玩家姿势和语音的电子游戏场景和角色控制方法,图1所示,具体步骤如下:
(1)获取帧图像:通过高速图像捕获模块从摄像头获取实时图像,不仅要分析每一帧,还要对相邻帧进行跟踪处理,同时考虑到控制的精度,要求采集速度达到实时;
(2)基于时空联系的分割:考虑到算法的简便性与鲁棒性的要求,我们设计了基于模型的分割方法,进一步结合时空相关性信息,消除噪声等引起的偏差,另外通过对亮度的分析补偿,从而尽可能的消除光照变化的影响;
(3)特征提取与识别:进一步分析和识别分割出来的区域,分别对不同区域单独进行特征分析,提取出具有旋转缩放不变性的特征,并通过上一时刻的结果进行跟踪校验及预测;
(4)参数提取:通过不同区域特征的相关性信息,例如相对位置和角度等,可以形成场景的控制信息,也可以提取位置坐标信息;
(5)语音输入:通过麦克风、声卡采集实时语音数据,包括降噪等预处理;
(6)语音识别:采用非特定人、连续语音识别方法,识别某些离散且实时性要求不高的命令,如启动,停止等;
(7)命令实现:最后将识别的结果,通过预先定义好的命令集进行映射转换,得到游戏的控制信息;
(8)多通道融合:将姿态和语音的控制信息结合,形成高效全面的游戏场景控制指令。
多通道的命令融合如图2所示:
键盘和鼠标的输入数据通过传统通道、麦克风的语音通过语音通道、摄像头的图像信号通过视频通道输入到多通道整合器,再输入到游戏控制器。
将视频和声音的识别结果,映射到相应的游戏控制中,其实例可参见图3。
图4的视频和声音的识别结果,映射到相应的游戏控制中,其基本步骤如下:
1)首先对场景控制命令进行分类,根据视频快速、具有连续模拟输出但比较简单直观的特点,以及语音具有自然快捷的特点,对所需的命令集进行分类,用姿态自然的控制场景的方向,用语音控制相关的启动,加速,停止等命令操作,形成完整的控制方式;
2)基于姿态的控制,首先需要设定各姿态及其相对位置与对应游戏场景控制的对应关系,然后通过摄像头,实时采集人体的姿态及其运动状态,进行在线分析和识别,根据当前的状态,采用一定的预测跟踪算法,输出相应的控制量;
3)基于语音的控制,首先需要建立关键词库,以及关键词与相关命令的映射表,然后通过麦克风采集玩家的语音信号,根据语音的识别结果,产生相应的控制命令;
4)游戏控制接口,将姿态语音的命令,实时整合到游戏的人物和场景控制中,或者直接调整模型达到控制的目的。

Claims (4)

1.一种基于玩家姿势和语音的电子游戏场景和角色控制方法,步骤包括:
①通过摄像头设备,实时捕获图像并进行光线校正,去噪等预处理;
②利用人体姿态运动的时间和空间特征进行分割,将分割后的图像进行特征提取、分析,求得姿态特征点位置,方向及他们组成的基本形状参数;通过规则处理,将标志的位置状态,转化为游戏控制命令;
③同时将从声卡获得的声音,采用现有的语音识别技术进行模型匹配识别,并转化为相应的游戏控制命令;
④最后,通过游戏的控制接口驱动游戏,或者直接修改自行开发游戏的内部模型参数。
2.根据权利要求1的基于玩家姿势和语音的电子游戏场景和角色控制方法,具体步骤如下:
(1)获取帧图像:通过高速图像捕获模块从摄像头获取实时图像,不仅要分析每一帧,还要对相邻帧进行跟踪处理,同时考虑到控制的精度,要求采集速度达到实时;
(2)基于时空联系的分割:考虑到算法的简便性与鲁棒性的要求,设计了基于模型的分割方法,进一步结合时空相关性信息,消除噪声等引起的偏差,另外通过对亮度的分析补偿,从而尽可能的消除光照变化的影响;
(3)特征提取与识别:进一步分析和识别分割出来的区域,分别对不同区域单独进行特征分析,提取出具有旋转缩放不变性的特征,并通过上一时刻的结果进行跟踪校验及预测;
(4)参数提取:通过不同区域特征的相关性信息,相对位置和角度,可以形成场景的控制信息,也可以提取位置坐标信息;
(5)语音输入:通过麦克风、声卡采集实时语音数据,包括降噪等预处理;
(6)语音识别:采用非特定人、连续语音识别方法,识别某些离散且实时性要求不高的命令,如启动,停止;
(7)命令实现:最后将识别的结果,通过预先定义好的命令集进行映射转换,得到游戏的控制信息;
(8)多通道融合:将姿态和语音的控制信息结合,形成高效全面的游戏场景控制指令。
3.根据权利要求2的基于玩家姿势和语音的电子游戏场景和角色控制方法,多通道融合:步骤如下:键盘和鼠标的输入数据通过传统通道、麦克风的语音通过语音通道、摄像头的图像信号通过视频通道输入到多通道整合器,再输入到游戏控制器。
4.根据权利要求1的基于玩家姿势和语音的电子游戏场景和角色控制方法,视频和声音的识别结果,映射到相应的游戏控制中,具体步骤如下:
1)首先对场景控制命令进行分类,根据视频快速、具有连续模拟输出但比较简单直观的特点,以及语音具有自然快捷的特点,对所需的命令集进行分类,用姿态自然的控制场景的方向,用语音控制相关的启动,加速,停止等命令操作,形成完整的控制方式;
2)基于姿态的控制,首先需要设定各姿态及其相对位置与对应游戏场景控制的对应关系,然后通过摄像头,实时采集人体的姿态及其运动状态,进行在线分析和识别,根据当前的状态,采用一定的预测跟踪算法,输出相应的控制量;
3)基于语音的控制,首先需要建立关键词库,以及关键词与相关命令的映射表,然后通过麦克风采集玩家的语音信号,根据语音的识别结果,产生相应的控制命令;
4)通过游戏控制接口,将姿态语音的命令,实时整合到游戏的人物和场景控制中,或者直接调整模型达到控制的目的。
CNB2004101018812A 2004-12-30 2004-12-30 基于玩家姿势和语音的电子游戏场景和角色控制方法 Expired - Fee Related CN100345085C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004101018812A CN100345085C (zh) 2004-12-30 2004-12-30 基于玩家姿势和语音的电子游戏场景和角色控制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004101018812A CN100345085C (zh) 2004-12-30 2004-12-30 基于玩家姿势和语音的电子游戏场景和角色控制方法

Publications (2)

Publication Number Publication Date
CN1797284A true CN1797284A (zh) 2006-07-05
CN100345085C CN100345085C (zh) 2007-10-24

Family

ID=36818346

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004101018812A Expired - Fee Related CN100345085C (zh) 2004-12-30 2004-12-30 基于玩家姿势和语音的电子游戏场景和角色控制方法

Country Status (1)

Country Link
CN (1) CN100345085C (zh)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010124584A1 (zh) * 2009-04-30 2010-11-04 武汉市高德电气有限公司 实景游戏装置及实现实景游戏的方法
CN101902554A (zh) * 2009-05-25 2010-12-01 戴维 智能化机顶盒及其图像处理方法
CN102008823A (zh) * 2009-04-26 2011-04-13 艾利维公司 控制视频游戏中物体移动的方法和系统
CN102129343A (zh) * 2010-01-15 2011-07-20 微软公司 运动捕捉系统中的受指导的表演
CN101534407B (zh) * 2008-03-12 2011-10-12 株式会社日立制作所 信息记录装置
CN102301315A (zh) * 2009-01-30 2011-12-28 微软公司 姿势识别器系统架构
CN102414641A (zh) * 2009-05-01 2012-04-11 微软公司 改变显示环境内的视图视角
CN102473032A (zh) * 2009-07-27 2012-05-23 三星电子株式会社 使用用户交互来控制电子装置的方法和设备
CN103127717A (zh) * 2011-12-02 2013-06-05 深圳泰山在线科技有限公司 控制操作游戏的方法及系统
CN101874404B (zh) * 2007-09-24 2013-09-18 高通股份有限公司 用于语音和视频通信的增强接口
CN103869962A (zh) * 2012-12-18 2014-06-18 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN102141839B (zh) * 2007-09-19 2015-04-29 索尼公司 图像处理设备和方法
CN105468138A (zh) * 2015-07-15 2016-04-06 武汉理工大学 基于脑机接口技术与激光雷达的智能车辆避障导航方法
CN105913039A (zh) * 2016-04-26 2016-08-31 北京光年无限科技有限公司 基于视觉和语音的对话数据交互处理方法及装置
CN106178538A (zh) * 2016-09-13 2016-12-07 成都创慧科达科技有限公司 一种基于姿态检测的智能玩具控制系统及方法
CN106569771A (zh) * 2015-10-09 2017-04-19 百度在线网络技术(北京)有限公司 对象控制方法及装置
CN106681683A (zh) * 2016-12-26 2017-05-17 汎达科技(深圳)有限公司 一种基于语音控制游戏操作的方法及装置
CN107340988A (zh) * 2012-10-01 2017-11-10 谷歌公司 具有连续关键词识别的免提设备
CN107424602A (zh) * 2017-05-25 2017-12-01 合肥泽诺信息科技有限公司 一种基于语音识别和人体姿态的人机交互式游戏引擎
WO2018006364A1 (zh) * 2016-07-07 2018-01-11 深圳狗尾草智能科技有限公司 一种基于虚拟环境的机器人训练方法和装置
CN108052927A (zh) * 2017-12-29 2018-05-18 北京奇虎科技有限公司 基于视频数据的手势处理方法及装置、计算设备
CN109582137A (zh) * 2018-11-15 2019-04-05 深圳市知更鸟旅游投资发展有限公司 一种行为动作识别系统及其方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US11314215B2 (en) 2017-09-15 2022-04-26 Kohler Co. Apparatus controlling bathroom appliance lighting based on user identity
US11093554B2 (en) 2017-09-15 2021-08-17 Kohler Co. Feedback for water consuming appliance
US10887125B2 (en) 2017-09-15 2021-01-05 Kohler Co. Bathroom speaker
US10448762B2 (en) 2017-09-15 2019-10-22 Kohler Co. Mirror
US11099540B2 (en) 2017-09-15 2021-08-24 Kohler Co. User identity in household appliances

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1031551A (ja) * 1996-07-15 1998-02-03 Mitsubishi Electric Corp ヒューマンインターフェースシステムおよびこれを使用した高速移動物体位置検出装置
US6072494A (en) * 1997-10-15 2000-06-06 Electric Planet, Inc. Method and apparatus for real-time gesture recognition
CN1468004A (zh) * 2002-06-27 2004-01-14 上海汉唐科技有限公司 基于时空梯度范围和分层结构的全局运动估计方法

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102141839B (zh) * 2007-09-19 2015-04-29 索尼公司 图像处理设备和方法
CN101874404B (zh) * 2007-09-24 2013-09-18 高通股份有限公司 用于语音和视频通信的增强接口
CN101534407B (zh) * 2008-03-12 2011-10-12 株式会社日立制作所 信息记录装置
CN102301315A (zh) * 2009-01-30 2011-12-28 微软公司 姿势识别器系统架构
CN102301315B (zh) * 2009-01-30 2014-12-24 微软公司 姿势识别器系统架构
CN102008823A (zh) * 2009-04-26 2011-04-13 艾利维公司 控制视频游戏中物体移动的方法和系统
CN102008823B (zh) * 2009-04-26 2014-12-10 艾利维公司 控制视频游戏中物体移动的方法和系统
WO2010124584A1 (zh) * 2009-04-30 2010-11-04 武汉市高德电气有限公司 实景游戏装置及实现实景游戏的方法
US9498718B2 (en) 2009-05-01 2016-11-22 Microsoft Technology Licensing, Llc Altering a view perspective within a display environment
CN102414641A (zh) * 2009-05-01 2012-04-11 微软公司 改变显示环境内的视图视角
CN102414641B (zh) * 2009-05-01 2014-03-12 微软公司 改变显示环境内的视图视角
CN101902554A (zh) * 2009-05-25 2010-12-01 戴维 智能化机顶盒及其图像处理方法
CN102473032A (zh) * 2009-07-27 2012-05-23 三星电子株式会社 使用用户交互来控制电子装置的方法和设备
US8284157B2 (en) 2010-01-15 2012-10-09 Microsoft Corporation Directed performance in motion capture system
US8465108B2 (en) 2010-01-15 2013-06-18 Microsoft Corporation Directed performance in motion capture system
CN102129343A (zh) * 2010-01-15 2011-07-20 微软公司 运动捕捉系统中的受指导的表演
CN103135881B (zh) * 2011-12-02 2016-12-14 深圳泰山体育科技股份有限公司 显示控制方法及系统
CN103127717A (zh) * 2011-12-02 2013-06-05 深圳泰山在线科技有限公司 控制操作游戏的方法及系统
CN103127717B (zh) * 2011-12-02 2016-02-10 深圳泰山在线科技有限公司 控制操作游戏的方法及系统
CN103135881A (zh) * 2011-12-02 2013-06-05 深圳泰山在线科技有限公司 显示控制方法及系统
CN107340988A (zh) * 2012-10-01 2017-11-10 谷歌公司 具有连续关键词识别的免提设备
CN107340988B (zh) * 2012-10-01 2020-10-20 谷歌有限责任公司 具有连续关键词识别的免提设备
CN103869962A (zh) * 2012-12-18 2014-06-18 联想(北京)有限公司 一种数据处理方法、装置及电子设备
CN104135619A (zh) * 2014-08-12 2014-11-05 广东欧珀移动通信有限公司 一种摄像头控制方法及装置
CN105468138A (zh) * 2015-07-15 2016-04-06 武汉理工大学 基于脑机接口技术与激光雷达的智能车辆避障导航方法
CN106569771A (zh) * 2015-10-09 2017-04-19 百度在线网络技术(北京)有限公司 对象控制方法及装置
CN105913039A (zh) * 2016-04-26 2016-08-31 北京光年无限科技有限公司 基于视觉和语音的对话数据交互处理方法及装置
CN105913039B (zh) * 2016-04-26 2020-08-18 北京光年无限科技有限公司 基于视觉和语音的对话数据交互处理方法及装置
WO2018006364A1 (zh) * 2016-07-07 2018-01-11 深圳狗尾草智能科技有限公司 一种基于虚拟环境的机器人训练方法和装置
CN106178538A (zh) * 2016-09-13 2016-12-07 成都创慧科达科技有限公司 一种基于姿态检测的智能玩具控制系统及方法
CN106681683A (zh) * 2016-12-26 2017-05-17 汎达科技(深圳)有限公司 一种基于语音控制游戏操作的方法及装置
CN107424602A (zh) * 2017-05-25 2017-12-01 合肥泽诺信息科技有限公司 一种基于语音识别和人体姿态的人机交互式游戏引擎
CN108052927A (zh) * 2017-12-29 2018-05-18 北京奇虎科技有限公司 基于视频数据的手势处理方法及装置、计算设备
CN108052927B (zh) * 2017-12-29 2021-06-01 北京奇虎科技有限公司 基于视频数据的手势处理方法及装置、计算设备
CN109582137A (zh) * 2018-11-15 2019-04-05 深圳市知更鸟旅游投资发展有限公司 一种行为动作识别系统及其方法

Also Published As

Publication number Publication date
CN100345085C (zh) 2007-10-24

Similar Documents

Publication Publication Date Title
CN100345085C (zh) 基于玩家姿势和语音的电子游戏场景和角色控制方法
CN112131988B (zh) 确定虚拟人物唇形的方法、装置、设备和计算机存储介质
CN112162628A (zh) 基于虚拟角色的多模态交互方法、装置及系统、存储介质、终端
CN111091824A (zh) 一种语音匹配方法及相关设备
CN101393599B (zh) 一种基于人脸表情的游戏角色控制方法
CN108874126B (zh) 基于虚拟现实设备的交互方法及系统
WO2019029100A1 (zh) 一种基于虚拟现实与增强现实的采矿操作多交互实现方法
JP2021192222A (ja) 動画インタラクティブ方法と装置、電子デバイス、コンピュータ可読記憶媒体、及び、コンピュータプログラム
US20110273551A1 (en) Method to control media with face detection and hot spot motion
CN100596186C (zh) 一种基于视频和音频的交互式数字多媒体制作方法
CN101086681A (zh) 基于立体视觉的游戏控制系统及方法
EP2391970A1 (en) Method for controlling and requesting information from displaying multimedia
CN103268153A (zh) 演示环境下基于计算机视觉的人机交互系统及交互方法
JP3844874B2 (ja) マルチモーダルインタフェース装置およびマルチモーダルインタフェース方法
CN101110102A (zh) 基于玩家拳头的游戏场景和角色控制方法
Camurri et al. EyesWeb-toward gesture and affect recognition in dance/music interactive systems
CN113723327A (zh) 一种基于深度学习的实时中文手语识别交互系统
CN115480923B (zh) 一种多模态的智慧教室边缘计算控制系统
Karpov et al. An assistive bi-modal user interface integrating multi-channel speech recognition and computer vision
CN114239610A (zh) 多国语言语音辨识及翻译方法与相关的系统
CN112788390B (zh) 一种基于人机交互的控制方法、装置、设备及存储介质
CN112261321B (zh) 字幕处理方法、装置及电子设备
CN114495946A (zh) 声纹聚类方法、电子设备和存储介质
Abraham et al. Virtual Mouse Using AI Assist for Disabled
Kumar et al. Machine Learning Approach for Gesticulation System Using Hand

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20071024

Termination date: 20151230

EXPY Termination of patent right or utility model