CN102156538A - 一种通过语音识别技术控制鼠标操作完成人机交互的方法 - Google Patents

一种通过语音识别技术控制鼠标操作完成人机交互的方法 Download PDF

Info

Publication number
CN102156538A
CN102156538A CN2011100613613A CN201110061361A CN102156538A CN 102156538 A CN102156538 A CN 102156538A CN 2011100613613 A CN2011100613613 A CN 2011100613613A CN 201110061361 A CN201110061361 A CN 201110061361A CN 102156538 A CN102156538 A CN 102156538A
Authority
CN
China
Prior art keywords
mouse
user
command set
command
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100613613A
Other languages
English (en)
Inventor
宋友
吴锡欣
张野
潘成伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beihang University
Original Assignee
Beihang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beihang University filed Critical Beihang University
Priority to CN2011100613613A priority Critical patent/CN102156538A/zh
Publication of CN102156538A publication Critical patent/CN102156538A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • User Interface Of Digital Computer (AREA)
  • Position Input By Displaying (AREA)

Abstract

一种通过语音识别技术控制鼠标操作完成人机交互的方法,属于计算机技术领域。在本发明中,通过计算机音频接收设备(如麦克风)接收用户语音命令,然后利用语音识别技术将用户的语音命令转化为对计算机鼠标的各项操作的控制命令,完成对现有鼠标的所有操作。本发明也可以帮助双手不灵活的残疾人、老年人等人群方便地使用计算机。本发明还具有自定义操作命令功能,用户不仅可以使用系统默认的鼠标控制命令集,还可以根据自己的习惯和喜好,通过界面化操作,定制对鼠标的个性化操作命令集。本发明使用时只需计算机现有的音频输入设备(话筒),无需增加其它设备。成本低,可以做到对所有计算机的普及。

Description

一种通过语音识别技术控制鼠标操作完成人机交互的方法
技术领域
本发明属于计算机技术领域,涉及一种基于语音识别技术的,通过计算机用户的语音命令控制计算机鼠标的各项操作的方法。
背景技术
目前,在计算机操作中,常用的鼠标键盘人机交互模式是计算机用户通过双手敲击键盘,移动鼠标来达到人机交互的目的。目前的鼠标主要有两种,一种是机械鼠标,一种是光电鼠标。机械鼠标用一个可四向滚动的胶质小球。这个小球在滚动时会带动一对转轴转动,在转轴的末端都有一个圆形的译码轮,译码轮上附有金属导电片与电刷直接接触。当转轴转动时,这些金属导电片与电刷就会依次接触,出现“接通”或“断开”两种形态,前者对应二进制数“1”、后者对应二进制数“0”。这些二进制信号被送交鼠标内部的专用芯片作解析处理并产生对应的坐标变化信号。只要鼠标在平面上移动,小球就会带动转轴转动,进而使译码轮的通断情况发生变化,产生一组组不同的坐标偏移量,反应到屏幕上,就是光标可随着鼠标的移动而移动。光电鼠标是在内部有一个发光二极管,通过该发光二极管发出的光线,照亮光电鼠标底部表面,然后将光电鼠标底部表面反射回的一部分光线,经过一组光学透镜,传输到微成像器内成像。这样,当光电鼠标移动时,其移动轨迹便会被记录为一组高速拍摄的连贯图像。最后利用光电鼠标内部的数字微处理器对移动轨迹上摄取的一系列图像进行分析处理,通过对这些图像上特征点位置的变化进行分析,来判断鼠标的移动方向和移动距离,从而完成光标的定位。
但是,这两种物理鼠标都要求计算机用户用手进行操作,使双手不灵活的残疾人、老年人等人群无法很好地使用计算机。对于正常人,语音控制使双手不必进行鼠标操作,而进行其他工作,同时也可以缓解长期鼠标操作带来的肩轴腕等身体部位的疲劳感,有利于身体健康。
发明内容
为了克服现有物理鼠标不能解放计算机用户双手,不能为病残人士所用的缺点,本发明提供了一种基于语音识别技术的,利用用户语音命令,控制计算机鼠标的方法,用户不需要动手,只需发出语音指令,就可以轻松完成鼠标的各项操作。
本发明所采用的技术方案是:通过音频接收设备,接收用户的语音指令,再通过语音识别引擎,将语音命令转换为计算机鼠标的控制命令,得到鼠标命令后,通过windows API调用,达到控制鼠标进行各种操作的目的。
本发明的有益效果是,可以改善现有的计算机人机交互模式,作为主流的基于鼠标键盘的人机交互模式是一个很有益的补充。对于正常人可以是原来仅能用于操作鼠标的手进行其他活动,还可以缓解用手进行鼠标操作带来的肩肘腕等身体部位的疲劳,从而提高计算机操作的效率,增加简便性。同时,对于残疾人士使用计算机也会有很大帮助。
附图说明
图1是本发明的主界面;
图2是命令自定义界面;
图3是鼠标信息框;
图4是软件帮助框;
图5是语音识别技术方案流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
1.启动声声动软件主界面。双击软件图标,打开软件。
主界面如“图1”所示。
2.语音操作。使用计算机默认声音录入设备(如默认麦克风)进行语音输入,用户说出语音命令,执行对应的操作。用户可以说出在主界面(图1)上显示的命令,执行对应操作,如方位命令完成对鼠标指针位置的确定、动作命令执行鼠标的“单击鼠标左键、双击鼠标左键、单击鼠标右键、单击鼠标中键、向上滚动、向下滚动”等事件。
系统的默认命令有:
Figure BDA0000050195230000021
Figure BDA0000050195230000031
3.声声动软件配置。在用户窗体信息界面(如图3),单击“命令自定制”链接,打开命令设置面板(如图2)。在面板对应位置输入新命令后,单击“确定”按钮完成命令内容的更新设置。
4.软件退出。单击主窗体(如图1)的“关闭”按钮,退出应用程序。

Claims (9)

1.一种通过语音识别技术控制鼠标操作完成人机交互的方法,特征在于将用户的语音命令转化为计算机中鼠标各种操作的命令,并通过界面化操作自定义语音控制命令。
2.根据权利要求1所述的方法,其特征在于,所述通过界面化操作自定义语音控制命令具体为,使用系统默认的命令集,或使用自己定义的个性化命令集。
3.根据权利要求2所述的方法,其特征在于,所述使用系统默认的命令集具体为,用户通过界面化操作对命令集进行修改后,所述修改后的命令集以特定文件格式保存在系统文件夹中并优先加载,使得用户可以使用上次用过的、自己习惯的命令集;当多个用户存在时,根据每个用户的个人信息保存不同用户各自对应的命令集。
4.根据权利要求1所述的方法,其特征在于,通过“往上”、“向下”、“左偏”、“右移”四个命令让鼠标分别沿上、下、左、右四个方向移动,通过“左上角”、“右上角”、“左下角”、“右下角”、“中央位置”五个命令将鼠标定位到屏幕的左上角、右上角、左下角、右下角、中央位置。
5.根据权利要求4所述的方法,其特征在于,鼠标沿各个方向运动的速度分为多个档,速度的增长符合Sigmoid型函数趋势;通过“加快”、“减慢”命令来提高或降低鼠标运动速度,通过“停”命令使运动的鼠标停止下来,完成定位。
6.根据权利要求1所述的方法,其特征在于,通过“单击鼠标”、“双击鼠标”、“右击鼠标”、“往上滚动”、“向下滚动”五个命令分别控制鼠标的五个事件:单击鼠标左键,双击鼠标左键,单击鼠标右键,往上滚动鼠标滚轮,往下滚动鼠标滚轮。
7.根据权利要求1所述的方法,其特征在于,通过“拖动”、“结束拖动”命令可以分别控制鼠标左键处于按下状态或者释放鼠标左键。
8.根据权利要求1所述的方法,其特征在于,通过“打开软键盘”,“关闭软键盘”两个命令分别控制打开或关闭系统附带的软键盘。
9.根据权利要求1所述的方法,其特征在于,通过系统命令“显示信息框”、“隐藏信息框”分别用于控制鼠标信息框的显示与隐藏;通过系统超级管理命令“监听鼠标”、“关闭鼠标监听”分别用于控制进入等候用户命令输入的待命状态与停止监听用户命令的睡眠状态,只有在待命状态下,用户输入的语音命令才被接受,处于睡眠状态时必须先通过“监听鼠标”命令唤醒,才能进行语音命令输入。
CN2011100613613A 2011-03-15 2011-03-15 一种通过语音识别技术控制鼠标操作完成人机交互的方法 Pending CN102156538A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011100613613A CN102156538A (zh) 2011-03-15 2011-03-15 一种通过语音识别技术控制鼠标操作完成人机交互的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011100613613A CN102156538A (zh) 2011-03-15 2011-03-15 一种通过语音识别技术控制鼠标操作完成人机交互的方法

Publications (1)

Publication Number Publication Date
CN102156538A true CN102156538A (zh) 2011-08-17

Family

ID=44438061

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100613613A Pending CN102156538A (zh) 2011-03-15 2011-03-15 一种通过语音识别技术控制鼠标操作完成人机交互的方法

Country Status (1)

Country Link
CN (1) CN102156538A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622085A (zh) * 2012-04-11 2012-08-01 北京航空航天大学 多维感官人机交互系统及交互方法
CN103634455A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 基于Annotation的语音命令提示方法和移动终端
CN103902023A (zh) * 2012-12-25 2014-07-02 苏州薇思雨软件科技有限公司 一种声控新型鼠标
CN105224082A (zh) * 2015-09-27 2016-01-06 邱少勐 系统故障实时求助报警装置
CN105955602A (zh) * 2016-04-19 2016-09-21 深圳市全智达科技有限公司 一种移动终端操作方法及装置
CN106210978A (zh) * 2016-07-25 2016-12-07 中科创达软件股份有限公司 一种声控麦克风
CN108008843A (zh) * 2017-03-25 2018-05-08 深圳雷柏科技股份有限公司 一种无线语音鼠标及语音操作系统
CN108663942A (zh) * 2017-04-01 2018-10-16 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN113362834A (zh) * 2021-06-02 2021-09-07 深圳云知声信息技术有限公司 一种鼠标唤醒方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020033338A (ko) * 2000-10-30 2002-05-06 강대수 음성인식 마우스 시스템 및 그 방법
CN1537267A (zh) * 2001-03-22 2004-10-13 ������������ʽ���� 信息处理装置和方法及程序
CN201467323U (zh) * 2009-02-27 2010-05-12 南京夏普电子有限公司 具有用户自定义菜单的电视机
CN101976186A (zh) * 2010-09-14 2011-02-16 方正科技集团苏州制造有限公司 一种计算机语音识别方法及其计算机

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020033338A (ko) * 2000-10-30 2002-05-06 강대수 음성인식 마우스 시스템 및 그 방법
CN1537267A (zh) * 2001-03-22 2004-10-13 ������������ʽ���� 信息处理装置和方法及程序
CN201467323U (zh) * 2009-02-27 2010-05-12 南京夏普电子有限公司 具有用户自定义菜单的电视机
CN101976186A (zh) * 2010-09-14 2011-02-16 方正科技集团苏州制造有限公司 一种计算机语音识别方法及其计算机

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
童强: "一种基于语音识别的声控鼠标的设计和实现", 《现代计算机》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622085A (zh) * 2012-04-11 2012-08-01 北京航空航天大学 多维感官人机交互系统及交互方法
CN103634455A (zh) * 2012-08-22 2014-03-12 百度在线网络技术(北京)有限公司 基于Annotation的语音命令提示方法和移动终端
CN103902023A (zh) * 2012-12-25 2014-07-02 苏州薇思雨软件科技有限公司 一种声控新型鼠标
CN105224082A (zh) * 2015-09-27 2016-01-06 邱少勐 系统故障实时求助报警装置
CN105955602A (zh) * 2016-04-19 2016-09-21 深圳市全智达科技有限公司 一种移动终端操作方法及装置
CN105955602B (zh) * 2016-04-19 2019-07-30 深圳市全智达科技有限公司 一种移动终端操作方法及装置
CN106210978A (zh) * 2016-07-25 2016-12-07 中科创达软件股份有限公司 一种声控麦克风
CN108008843A (zh) * 2017-03-25 2018-05-08 深圳雷柏科技股份有限公司 一种无线语音鼠标及语音操作系统
CN108663942A (zh) * 2017-04-01 2018-10-16 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN108663942B (zh) * 2017-04-01 2021-12-07 青岛有屋科技有限公司 一种语音识别设备控制方法、语音识别设备和中控服务器
CN113362834A (zh) * 2021-06-02 2021-09-07 深圳云知声信息技术有限公司 一种鼠标唤醒方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
CN102156538A (zh) 一种通过语音识别技术控制鼠标操作完成人机交互的方法
US20220261083A1 (en) Gesture-based user interface
US9791918B2 (en) Breath-sensitive digital interface
Lee et al. Towards augmented reality driven human-city interaction: Current research on mobile headsets and future challenges
CN108089727B (zh) 用于屏幕的手写键盘
CN106233240B (zh) 交互式显示器上的文本输入
Karam A taxonomy of gestures in human computer interactions
EP3087456B1 (en) Remote multi-touch control
Serrano et al. Bezel-Tap gestures: quick activation of commands from sleep mode on tablets
Aghajan et al. Human-centric interfaces for ambient intelligence
TW201610784A (zh) 具曲面顯示器之電子裝置及其控制方法
CN104145232A (zh) 用于注视交互的系统
CN110069101B (zh) 一种穿戴式计算设备和一种人机交互方法
KR102297473B1 (ko) 신체를 이용하여 터치 입력을 제공하는 장치 및 방법
Liang et al. DRG-Keyboard: Enabling subtle gesture typing on the fingertip with dual IMU rings
Dim et al. Designing motion marking menus for people with visual impairments
Oakley et al. Motion marking menus: An eyes-free approach to motion input for handheld devices
Lang et al. A multimodal smartwatch-based interaction concept for immersive environments
Aoki et al. Expanding kinds of gestures for hierarchical menu selection by unicursal gesture interface
Knierim et al. The SmARtphone Controller: Leveraging Smartphones as Input and Output Modality for Improved Interaction within Mobile Augmented Reality Environments
CN103186264A (zh) 触控式电子装置及其触控方法
TW201211839A (en) Command manipulation method of dual touch control input mode
Lee et al. Mouse operation on monitor by interactive analysis of intuitive hand motions
KR20110013076A (ko) 카메라 시스템을 이용한 손짓 및 터치형 양손 반지 마우스 입력 장치
US20230393670A1 (en) Lismart computer pointing device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20110817